马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
Python 最近出了个大新闻:PEP-750 t-string 语法被正式接纳了!
这意味着 Python 将在今年 10 月发布的 3.14 版本中引入一种新的字符串前缀 t,称为模板字符串(Template Strings),即 t-string。
这是继 f-string 之后,字符串处理本领的重大升级,旨在提供更安全、更灵活的字符串插值处理机制。
t-string 的基本语法与 f-string 非常相似,但得到的结果却大为不同:- name = "World"
- # f-string 语法
- formatted = f"Hello {name}!"
- print(type(formatted)) # 输出:<class 'str'>
- print(formatted) # 输出:Hello World!
- # t-string 语法
- templated = t"Hello {name}!"
- print(type(templated)) # 输出:<class 'string.templatelib.Template'>
- print(templated.strings) # 输出:('Hello ', '')
- print(templated.interpolations[0].value) # 输出:World
- print("".join(
- item if isinstance(item, str) else str(item.value)
- for item in templated
- )) # 输出:Hello World!
复制代码 如上所述,t-string 与 f-string 不同的是,它不会立即得到普通字符串,而是返回一个新的范例 Template(来自 Python 3.14 新增的标准库模块 string.templatelib)。
这个范例不能直接作为普通字符串输出,但它提供了对字符串和其内部插值表达式的布局化访问,使得开发者能够在字符串组合插入值前添加拦截和转换。
一句话总结 t-string 的焦点特点就是延迟渲染。
为什么要计划 t-string?
f-string 因其简洁易用而广受欢迎,但它也存在一些无法忽视的局限性:
- 安全隐患:当直接将用户输入嵌入到 SQL 查询、HTML 内容或系统命令中时,f-string 可能导致注入攻击
- 缺乏转换本领:f-string 没有提供在字符串组合前拦截和转换插入值的机制
- 灵活性不足:对于复杂的字符串处理任务,f-string 的本领有限
提升字符串处理的安全性
不谨慎利用 f-string,可能导致安全毛病:- # 使用 f-string 的不安全示例(SQL 注入风险)
- sql_query = f"SELECT * FROM users WHERE name = '{user_input}'"
- # 使用 f-string 的不安全示例(XSS 风险)
- html_content = f"{user_input}"
复制代码 而 t-string 允许开发者在字符串组合前对插值举行恰当处理:- # 使用 t-string 的安全示例
- evil = ""
- template = t"<p>{evil}</p>"
- # 可以定义处理函数来转义内容
- assert html(template) == "<p><script>alert('evil')</script></p>"
复制代码 增强字符串处理的灵活性
t-string 最大的上风在于它提供了同一的字符串处理机制,让开发者可以根据现实需求实现各种自定义渲染逻辑。这种计划克制了为每种场景创建专门语法的复杂性,同时保持了 Python 简洁同一的风格。
以下示例展示了怎样基于同一个 t-string 模板,利用不同的渲染器输出不同的格式:- from string.templatelib import Template, Interpolation
- data = {"name": "Python猫", "age": 18}
- template = t"用户 {data['name']} 的年龄是 {data['age']}"
- def standard_renderer(template: Template) -> str:
- """标准文本渲染"""
- return "".join(
- item if isinstance(item, str) else str(item.value)
- for item in template
- )
- def json_renderer(template: Template) -> str:
- """JSON格式渲染"""
- import json, re
- values = {}
- for item in template:
- if not isinstance(item, str):
- # 使用正则表达式从表达式中提取键名
- # 匹配 data['name'] 或 data["name"] 模式中的name
- match = re.search(r"\['([^']+)'\]|\["([^"]+)"\]", item.expression)
- if match:
- # 获取匹配的第一个分组
- key = match.group(1) if match.group(1) else match.group(2)
- values[key] = item.value
- return json.dumps(values, ensure_ascii=False)
-
- def xml_renderer(template: Template) -> str:
- """XML格式渲染"""
- parts = ["<data>"]
- for item in template:
- if not isinstance(item, str) and hasattr(item, "expression"):
- name = item.expression.split("'")[1] if "'" in item.expression else item.expression
- parts.append(f" <{name}>{item.value}</{name}>")
- parts.append("</data>")
- return "\n".join(parts)
- # 同一个模板,不同的输出格式
- print(standard_renderer(template)) # 输出: 用户 Python猫 的年龄是 18
- print(json_renderer(template)) # 输出: {"name": "Python猫", "age": 18}
- print(xml_renderer(template)) # 输出: <data>\n <name>Python猫</name>\n <age>18</age>\n</data>
复制代码 这种灵活性是 f-string 所不具备的,对于构建各种 DSL(领域特定语言)、模板引擎或格式化系统非常有价值。
Template 类的布局
t-string 求值后的 Template 类具有以下主要属性和方法:- class Template:
- strings: tuple[str, ...]
- """
- 模板中字符串部分的非空元组。
- 包含 N+1 个元素,其中 N 是模板中插值表达式的数量。
- """
- interpolations: tuple[Interpolation, ...]
- """
- 模板中插值部分的元组。
- 如果没有插值表达式,这将是一个空元组。
- """
- def __new__(cls, *args: str | Interpolation):
- """
- 创建一个新的 Template 实例。
- 参数可以按任意顺序提供。
- """
- ...
- @property
- def values(self) -> tuple[object, ...]:
- """
- 返回模板中每个 Interpolation 的 `value` 属性组成的元组。
- 如果没有插值表达式,这将是一个空元组。
- """
- ...
- def __iter__(self) -> Iterator[str | Interpolation]:
- """
- 迭代模板中的字符串部分和插值表达式。
- 这些可能以任意顺序出现。不包含空字符串。
- """
- ...
复制代码 这种布局使开发者能够:
- 访问原始字符串片段(strings)
- 访问插值表达式及其计算结果(interpolations)
- 直接获取所有插值的值(values)
- 按顺序迭代模板的所有组成部门
注:__iter__ 函数注释说出现顺序不固定,但 PEP 文档中它的详细实现却是按序的,我认为是注释有误。
t-string 与 f-string 的异同点
相似之处
- 基本语法:二者都利用花括号 {} 作为插值表达式的分隔符
- 表达式求值:都支持在花括号中放置任意 Python 表达式
- 格式阐明符:都支持格式阐明符(如 .2f)和转换阐明符(如 !r)
- 引号支持:都支持所有有效的引号标记('、"、'''、""")
- 巨细写不敏感前缀:t 和 T 都是有效的,就像 f 和 F
不同之处
- 返回范例:f-string 直接返回 str 范例,而 t-string 返回 Template 范例
- 求值时机:f-string 在定义时立即求值,t-string 提供延迟求值本领
- 布局访问:t-string 允许访问原始模板的布局(字符串部门和插值部门)
- 处理模型:f-string 是"即时完成"模型,t-string 是"预处理+转换"模型
t-string 的应用场景
1. 安全的 HTML 模板
利用 t-string 可以创建出主动转义用户输入的 HTML 模板:- def html(template: Template) -> str:
- parts = []
- for item in template:
- if isinstance(item, str):
- parts.append(item)
- else: # Interpolation
- parts.append(html_escape(item.value))
- return "".join(parts)
- user_input = ""
- safe_html = html(t"{user_input}")
- # 输出: <script>alert('XSS')</script>
复制代码 2. 安全的 SQL 查询构建
t-string 可以构建防注入的 SQL 查询:- def safe_sql(template: Template) -> str:
- parts = []
- params = []
-
- for item in template:
- if isinstance(item, str):
- parts.append(item)
- else:
- parts.append("?")
- params.append(item.value)
-
- return "".join(parts), params
- user_id = "user' OR 1=1--"
- query, params = safe_sql(t"SELECT * FROM users WHERE id = {user_id}")
- # query: "SELECT * FROM users WHERE id = ?"
- # params: ["user' OR 1=1--"]
复制代码 3. 布局化日志
利用 t-string 可以实现优雅的布局化日志记录:- import json
- import logging
- from string.templatelib import Template, Interpolation
- class TemplateMessage:
- def __init__(self, template: Template) -> None:
- self.template = template
-
- @property
- def message(self) -> str:
- # 格式化为可读消息
- return f(self.template) # 使用自定义 f() 函数
-
- @property
- def values(self) -> dict:
- # 提取结构化数据
- return {
- item.expression: item.value
- for item in self.template.interpolations
- }
-
- def __str__(self) -> str:
- return f"{self.message} >>> {json.dumps(self.values)}"
- action, amount, item = "traded", 42, "shrubs"
- logging.info(TemplateMessage(t"User {action}: {amount:.2f} {item}"))
- # 输出: User traded: 42.00 shrubs >>> {"action": "traded", "amount": 42, "item": "shrubs"}
复制代码 4. 安全的子进程调用
PEP-787 专门针对 t-string 在子进程调用中的场景作了扩展,使 subprocess 模块能原生支持 t-string:- # 不安全的 f-string 用法
- subprocess.run(f"echo {message_from_user}", shell=True) # 命令注入风险
- # 安全的 t-string 用法
- subprocess.run(t"echo {message_from_user}") # 自动进行适当的命令转义
复制代码 这种方式既保留了字符串命令的可读性,又克制了安全风险。
t-string 的进阶用法
1. 自定义多功能模板渲染器
t-string 的真正威力在于可以自定义渲染器模板:- from string.templatelib import Template, Interpolation
- import html
- def smart_renderer(template: Template, context="text") -> str:
- """上下文感知的渲染器
- 根据context参数自动决定如何处理每个插值:
- - "text": 普通文本模式,直接转为字符串
- - "html": HTML模式,自动转义HTML特殊字符,防止XSS
- - "sql": SQL模式,自动转义SQL特殊字符,防止注入
- """
- parts = []
-
- for item in template:
- if isinstance(item, str):
- parts.append(item)
- else: # Interpolation
- value = item.value
- expression = item.expression
-
- # 基于值类型和上下文进行智能处理
- if context == "html":
- # HTML模式:自动转义HTML特殊字符
- parts.append(html.escape(str(value)))
- elif context == "sql":
- # SQL模式:防止SQL注入
- if isinstance(value, str):
- # 将1个单引号转义成2个
- escaped_value = value.replace("'", "''")
- parts.append(f"'{escaped_value}'")
- elif value is None:
- parts.append("NULL")
- else:
- parts.append(str(value))
- else:
- parts.append(str(value))
-
- return "".join(parts)
- # 同一个模板在不同上下文中的自动适配渲染
- user_input = ""
- template = t"用户输入: {user_input}"
- print(smart_renderer(template, context="html")) # 输出: 用户输入: <script>alert('evil')</script>
- # SQL注入防护示例
- user_id = "1'; DROP TABLE users; --"
- sql_template = t"SELECT * FROM users WHERE id = {user_id}"
- print(smart_renderer(sql_template, context="sql")) # 输出: SELECT * FROM users WHERE id = '1''; DROP TABLE users; --'
- # f-string 对于SQL注入,必须先处理值,再放入f-string
- escaped_id = user_id.replace("'", "''")
- sql_safe_id = f"'{escaped_id}'"
- print(f"SQL查询(f-string): SELECT * FROM users WHERE id = {sql_safe_id}")
复制代码 2. 布局化嵌套模板处理
t-string 和 f-string 在嵌套利用时有本质区别:- # f-string的嵌套:内部表达式立即求值,信息丢失
- value = "world"
- inner_f = f"inner {value}"
- outer_f = f"outer {inner_f}"
- print(outer_f) # 输出: outer inner world
- print(type(outer_f)) # <class 'str'> - 只是普通字符串
- # t-string的嵌套:保留完整结构信息
- inner_t = t"inner {value}"
- outer_t = t"outer {inner_t}"
- print(type(outer_t)) # <class 'string.templatelib.Template'>
- print(type(outer_t.interpolations[0].value)) # 也是Template对象!
- # 可以访问和处理任意深度的嵌套结构
- user = {"name": "Alice", "age": 30}
- message = t"用户{user['name']}信息: {t'年龄:{user['age']}'}"
- inner_template = message.interpolations[1].value
- print(inner_template.strings) # 输出: ('年龄:', '')
- print(inner_template.interpolations[0].value) # 输出: 30
复制代码 这种布局化处理本领使 t-string 特别恰当构建复杂的模板系统,可以按需延迟或自定义渲染过程的所有部门。
3. 延迟求值与异步处理
t-string 的布局特性使得它支持延迟求值和异步处理。以下是异步模板渲染示例:- import asyncio
- # 模拟异步数据获取
- async def fetch_data(key: str) -> str:
- await asyncio.sleep(0.1) # 模拟网络延迟
- return f"获取的{key}数据"
- async def render_async(template):
- tasks = {}
- # 并行启动所有异步查询
- for item in template.interpolations:
- tasks[item.expression] = asyncio.create_task(
- fetch_data(item.expression)
- )
-
- # 等待所有查询完成
- for expr, task in tasks.items():
- tasks[expr] = await task
-
- # 组装结果
- result = []
- for item in template:
- if isinstance(item, str):
- result.append(item)
- else:
- result.append(tasks[item.expression])
-
- return "".join(result)
- async def main():
- template = t"用户: {user}, 年龄: {age}"
- result = await render_async(template)
- print(result)
- # asyncio.run(main())
复制代码 这种模式的关键上风:
- 布局保留: 可以获取完整表达式信息
- 并行获取: 同时处理多个异步任务
- 延迟组合: 等所有数据就绪再拼接
总结
Python 的 t-string 语法是对字符串处理本领的紧张扩展,它在保持与 f-string 语法相似性的同时,提供了更灵活、更安全的字符串插值处理机制。通过将字符串模板布局化为 Template 对象,开发者可以在字符串组合前对插值举行拦截和转换,从而克制常见的安全问题,并支持更多高级用例。
它就像是数据与视图的分离模式,f-string 是直接渲染的视图,而 t-string则保留了数据模型,允许你在最终呈现前实行各种转换规则和验证。
t-string 的计划理念体现了功能性与安全性的均衡,虽然它比 f-string 更复杂,但这种复杂性带来了更高级的可组合性和更强的安全保障。
它依照了 Python 的"显式优于隐式"原则,通过明确分离模板布局和渲染过程,让字符串处理的每个步调都清晰可见。
t-string 并不是一种替换 f-string 的语法,f-string 的简单易用性依然有其紧张价值。
那么,在 Python 3.14 版本后,两个字符串插值方法该怎样选择呢?
一句话总结:当只需简单地格式化字符串时,利用 f-string 更直接高效;而当处理不受信任的输入、需要自定义渲染逻辑、构建复杂模板系统或举行异步处理时,应选择功能更强大的 t-string。
参考资料
Python 潮流周刊第3季总结,附电子书下载:https://pythoncat.top/posts/2025-04-20-sweekly
Python 潮流周刊第二季完结(31~60):https://pythoncat.top/posts/2025-04-20-iweekly
Python 潮流周刊第 2 季完结了,分享几项总结:https://pythoncat.top/posts/2024-07-14-iweekly
Python 潮流周刊第2季(31~60)-纯链接版:https://pythoncat.top/posts/2025-04-19-sweekly
Python 潮流周刊第一季英华合集(1~30):https://pythoncat.top/posts/2023-12-11-weekly
万字浓缩版,Python 潮流周刊第 1 季的 800 个链接!:https://xiaobot.net/post/78c3d645-86fa-4bd8-8eac-46fb192a339e
微信关注 Python猫:https://img.pythoncat.top/python_cat.jpg
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |