生存为json中文Unicode乱码:
可以看到,中文字符没有乱码,只是出现了反斜杠,此时解决方法应考虑是否举行了二次序列化。
一、缘故原由1
在dump时参加ensure_ascii=False 即可解决,即json.dump(json_data, f, indent=4, ensure_ascii=False)
二、缘故原由2
json.dumps(data_dict, ensure_ascii=False)已经举行了序列化,在写入文件时,又采用json.dump(json_data, f, indent=4, ensure_ascii=False)方法导致二次序列化,改为f.write(json_data)即可。
- import os
- import json
- import numpy as np
- np.set_printoptions(linewidth=400)
- data_list = []
- result_list = []
- is_duplicate = []
- for filename in os.listdir("./log_data"):
- print(filename)
- with open("./log_data/" + filename, 'r', encoding="utf-8") as f:
- line = f.readline()
- while line:
- data = line[line.find("【param】") + len("【param】") + 1:line.find("【result】") - 2]
- result = line[line.find("【result】") + len("【result】") + 1:line.find(", 【headers】")]
- data_list.append(data)
- result_list.append(result)
- line = f.readline()
- effective_set = set()
- print(len(data_list))
- for data in data_list:
- try:
- data_dict = json.loads(data)
- trace_id = data_dict.pop("trace_id")
- print(data_dict["match_start_date"])
- effective_set.add(json.dumps(data_dict, ensure_ascii=False))
- except:
- pass
- continue
- print(len(effective_set))
- n = 1
- for json_data in effective_set:
- if n <= 87:
- with open("./log_data2json/" + f'{hash(json_data)}' + ".json", 'w', encoding="utf-8") as f:
- # json.dump(json_data, f, indent=4, ensure_ascii=False)
- f.write(json_data) # 避免二次序列化
- n += 1
- print(n)
复制代码 json.dump()与json.dumps()的区别
json.dumps():将Python字典转为字符串:
- import json
- # 定义 Python 对象
- data = {
- "name": "John",
- "age": 30,
- "city": "New York"
- }
- # 将 Python 对象转换为 JSON 字符串
- json_str = json.dumps(data)
- # 打印 JSON 字符串
- print(json_str)
复制代码 json.dump将Python字典写入文件:
- import json
- # 定义 Python 对象
- data = {
- "name": "John",
- "age": 30,
- "city": "New York"
- }
- # 打开文件并将 Python 对象写入文件
- with open('data.json', 'w') as f:
- json.dump(data, f)
复制代码 json.load()与json.loads()的区别
json.load()读取文件,转化为字典:
- with open('s.json', 'r') as f:
- s1 = json.load(f) # dict
复制代码 json.loads()将字符串转为字典:
- s = '{"name": "wade", "age": 54, "gender": "man"}'
- type(json.loads(s))) # dict
复制代码 总结
加s的(loads、dumps)操作的是字符串
不加s的(load、dump)操作的是文件,用于读写文件。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |