马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
我不停在探索如何让Python快速地检索数据,除了把数据装在py文件里,一起打包之外,我还实验过把数据放到json文件里或CSV文件里,这样就可以快速地检索到我们想要的数据。思量到检索数据库sql格式的文件,我还没有做过,今天就请出DeepSeek,让它来帮我把我的数据转化为一个sql文件,然后用python生成一个tkinter框架的UI界面,效果发现查询速度飞快。以下的工具的截图。
一、功能介绍
这个工具,可以快速地读取指定的sql格式文件,找到单词的多个变形,或者输入变形来查找它的本相。其主要特别是检索速度快,图形界面,多个检索模式。采取数据库来存储文件。
二、制作过程
1. 收集数据,明白使命
找到en_lemma.py格式的文件,把里面存储的数据写入到xlsx当中。文件内容如下:
en_lemma.py内容
我请DeepSeek为我生成了一段代码如下:
- from openpyxl import Workbook
- from en_lemma import lemmas # 导入字典数据
- # 创建新工作簿并获取活动工作表
- wb = Workbook()
- ws = wb.active
- # 遍历字典的键值对
- for key, values in lemmas.items():
- # 构造行数据:键作为第一列,后面接列表元素
- row_data = [key] + values
- # 将数据写入工作表
- ws.append(row_data)
- # 保存Excel文件
- wb.save("lemmas_data.xlsx")
复制代码 2. 修改xlsx文件,生成sql数据库
我们利用Python中的pandas包和sqlite3包把这个lemmas_data.xlsx转化为sql数据库,代码如下:
- import pandas as pd
- import sqlite3
- # 1. 读取 Excel 文件
- excel_file = "en_lemmas.xlsx" # Excel 文件路径
- sheet_name = "Sheet1" # Excel 工作表名称
- df = pd.read_excel(excel_file, sheet_name=sheet_name)
- # 2. 创建 SQLite 数据库
- sqlite_db = "verb_forms.db" # SQLite 数据库文件路径
- conn = sqlite3.connect(sqlite_db)
- cursor = conn.cursor()
- # 3. 创建表
- create_table_query = """
- CREATE TABLE IF NOT EXISTS verb_forms (
- id INTEGER PRIMARY KEY AUTOINCREMENT,
- base_form TEXT NOT NULL,
- variant TEXT NOT NULL
- );
- """
- cursor.execute(create_table_query)
- # 4. 将数据插入 SQLite 表
- for index, row in df.iterrows():
- base_form = row["BaseForm"] # 假设 A 列是 BaseForm
-
- # 遍历 B、C、D 列(Variant1, Variant2, Variant3)
- for col in ["Variant1", "Variant2", "Variant3", "Variant4", "Variant5", "Variant6"]:
- variant = row[col]
-
- # 检查是否为有效值(非空)
- if pd.notna(variant) and variant.strip() != "":
- # 使用参数化查询避免 SQL 注入和特殊字符问题
- insert_query = """
- INSERT INTO verb_forms (base_form, variant)
- VALUES (?, ?);
- """
- cursor.execute(insert_query, (base_form, variant.strip()))
- # 5. 提交更改并关闭连接
- conn.commit()
- conn.close()
- print(f"数据已成功导入 SQLite 数据库: {sqlite_db}")
复制代码 代码使用前,要把lemmas_data.xlsx文件打开,在首行插入一行,为每一列增加标题。第一列为BaseForm,第二列为Variant1,第二列为Variant2,依次类推。然后再改名为en_lemmas.xlsx后,再运行上述代码。

en_lemmas.xlsx文件内容
3. 使用Tkinter,编写检索界面
采取DeepSeek编写一个UI界面的检索软件,可视化呈现检索效果。编写前先在非可视化界面下测试软件,于时我们得到一个简单的检索代码:
- import sqlite3
-
- def get_base_form(word_to_find: str) -> str:
- try:
- # 连接数据库(自动处理相对路径)
- with sqlite3.connect("verb_forms.db") as conn:
- cursor = conn.cursor()
- # 参数化查询防止 SQL 注入
- cursor.execute(
- "SELECT base_form FROM verb_forms WHERE variant = ?",
- (word_to_find,)
- )
- result = cursor.fetchone()
- return result[0] if result else "" # 关键修复:去掉括号
- except sqlite3.Error as e:
- print(f"数据库错误:{e}")
- return ""
-
- # 测试代码
- if __name__ == "__main__":
- test_word = "thought"
- base_form = get_base_form(test_word)
- if base_form:
- print(f"单词 '{test_word}' 的基本形式是:{base_form}")
- else:
- print(f"未找到 '{test_word}' 的基本形式")
复制代码 然后,根据这个检索代码,进一步扩展,添加UI界面,最终得到以下代码:
- import sqlite3
- import tkinter as tk
- from tkinter import ttk
- from tkinter import messagebox
- def get_base_form(word_to_find: str) -> str:
- try:
- # 连接数据库(自动处理相对路径)
- with sqlite3.connect("verb_forms.db") as conn:
- cursor = conn.cursor()
- # 参数化查询防止 SQL 注入
- cursor.execute(
- "SELECT base_form FROM verb_forms WHERE variant = ?",
- (word_to_find,)
- )
- result = cursor.fetchone()
- return result[0] if result else ""
- except sqlite3.Error as e:
- messagebox.showerror(" 数据库错误", f"数据库错误:{e}")
- return ""
- def get_variants(word_to_find: str) -> list:
- try:
- with sqlite3.connect("verb_forms.db") as conn:
- cursor = conn.cursor()
- # 先验证输入的是否为有效原形
- cursor.execute("SELECT base_form FROM verb_forms WHERE base_form = ?", (word_to_find,))
- if not cursor.fetchone():
- return [] # 不是有效原形则直接返回空
- # 查询变形
- cursor.execute("SELECT variant FROM verb_forms WHERE base_form = ?", (word_to_find,))
- return [row[0] for row in cursor.fetchall()]
- except sqlite3.Error as e:
- messagebox.showerror(" 数据库错误", f"数据库错误:{e}")
- return []
- def query():
- word = entry.get()
- if choice.get() == 1:
- base_form = get_base_form(word)
- if base_form:
- result_text.delete(1.0, tk.END)
- result_text.insert(tk.END, f"单词【{word}】的基本形式是:{base_form}")
- else:
- result_text.delete(1.0, tk.END)
- result_text.insert(tk.END, f"未找到【{word}】的基本形式")
- elif choice.get() == 2:
- variants = get_variants(word)
- result_text.delete(1.0, tk.END)
- if variants:
- # 显示变形列表
- result_text.insert(tk.END, f"原形【{word}】的变形:\n" + ", ".join(variants))
- else:
- # 分情况提示
- try:
- with sqlite3.connect("verb_forms.db") as conn:
- cursor = conn.cursor()
- cursor.execute("SELECT base_form FROM verb_forms WHERE variant = ?", (word,))
- if cursor.fetchone():
- result_text.insert(tk.END, f"注意:您输入的是变形单词,请切换至「原形」模式查询")
- else:
- result_text.insert(tk.END, f"数据库未收录【{word}】的相关变形")
- except sqlite3.Error as e:
- messagebox.showerror(" 数据库错误", f"数据库错误:{e}")
- def copy_text():
- result_text.clipboard_clear()
- result_text.clipboard_append(result_text.selection_get())
- def cut_text():
- copy_text()
- result_text.delete(tk.SEL_FIRST, tk.SEL_LAST)
- def paste_text():
- result_text.insert(tk.INSERT, result_text.clipboard_get())
-
- def entry_copy():
- try:
- # 获取 Entry 选中内容并复制
- entry.clipboard_clear()
- entry.clipboard_append(entry.selection_get())
- except tk.TclError:
- pass # 无选中内容时不操作
-
- def entry_cut():
- entry_copy() # 先复制
- try:
- entry.delete(tk.SEL_FIRST, tk.SEL_LAST) # 再删除选中内容
- except tk.TclError:
- pass
-
- def entry_paste():
- entry.insert(tk.INSERT, entry.clipboard_get()) # 插入剪贴板内容
- # 创建主窗口
- root = tk.Tk()
- root.title(" 单词查询")
- # 设置所有标准控件的默认字体
- root.option_add("*Font", ("Times New Roman", 14)) # 影响 Entry、Button 等非 ttk 控件
- # 设置 ttk 控件的主题字体
- style = ttk.Style()
- style.configure(".", font=("Times New Roman", 14)) # 通配符 . 表示所有 ttk 控件
- # 创建输入框、单选按钮和查询按钮
- frame_top = ttk.Frame(root)
- frame_top.pack(pady=10)
- entry = ttk.Entry(frame_top, width=20)
- entry.pack(side=tk.LEFT, padx=5)
- entry.bind("<Return>", lambda event: query()) # 按回车触发查询
- entry.focus_set()
- # 创建 Entry 的右键菜单
- entry_menu = tk.Menu(entry, tearoff=0)
- entry_menu.add_command(label=" 剪切", command=entry_cut)
- entry_menu.add_command(label=" 复制", command=entry_copy)
- entry_menu.add_command(label=" 粘贴", command=entry_paste)
-
- def show_entry_menu(event):
- entry_menu.post(event.x_root, event.y_root) # 显示菜单
-
- entry.bind("<Button-3>", show_entry_menu) # 绑定右键事件
- choice = tk.IntVar()
- choice.set(2)
- radio1 = ttk.Radiobutton(frame_top, text="原形", variable=choice, value=1)
- radio1.pack(side=tk.LEFT, padx=5)
- radio2 = ttk.Radiobutton(frame_top, text="变形", variable=choice, value=2)
- radio2.pack(side=tk.LEFT, padx=5)
- query_button = ttk.Button(frame_top, text="查询", command=query)
- query_button.pack(side=tk.LEFT, padx=5)
- # 创建结果显示文本框
- result_text = tk.Text(root, height=10, width=60)
- result_text.pack(pady=10)
- # 创建右键菜单
- menu = tk.Menu(result_text, tearoff=0)
- menu.add_command(label=" 复制", command=copy_text)
- menu.add_command(label=" 剪切", command=cut_text)
- menu.add_command(label=" 粘贴", command=paste_text)
- def show_menu(event):
- menu.post(event.x_root, event.y_root)
-
- result_text.bind("<Button-3>", show_menu)
- # 运行主循环
- root.mainloop()
复制代码 在编写上述代码中,主要办理了以下几个问题:
1)本相和变形选错时的主动调节;2)查询按钮绑定回车键,回车就可以实现检索;3)在Entry和Text的控件里都添加了右键菜单,可以非常方便地举行复制和粘贴操作。
三、学后总结
1. 通过Python把xlsx文件转化为sql文件,并编写可视化界面来检索这个数据库,快速得到想要的内容。
2. Python不愧是瑞士军刀,在读取数据类型方面是别的工具无法逾越的。这次我们充实发挥Python的胶水作用,sql文件检索速度快的特点,实现了一个小型语料库的快速检索。
3. 如果我们的语料库有几十万句对,生成一个sql后再用python检索,岂不实现了数据库检索的功能?这个问题得当我们后期继续举行探究。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。 |