【01】大模子原理与API使用

打印 上一主题 下一主题

主题 2062|帖子 2062|积分 6186

本篇目的
·AIGC发展:从GPT1到GPT4
·AIGC的表现与上风
·AIGC的通用能力应用
·大模子API使用
CASE-情感分析-Qwen
CASE-天气Function-Qwen
CASE-表格提取-Qwen
CASE-运维事件处置-Qwen
AI 的分类



  • 分析式AI : 也称为鉴别式AI,其核心使命是对已有数据举行分类、猜测或决策。
    上风在于其高精度和高效性,但其局限性在于仅能处理已有数据的模式,无法创造新内容.
  • 生成式AI:专注于创造新内容,例如文本、图像、音等。突破在于其创迪性和机动性,但也面临败据隐私、版权掩护等挑衅
chatgpt 的发展历史

版本时间特点GPT2018最初版本,提出基于 Transformer 的语言建模思路GPT-22019增大模子规模(15亿参数),展示出惊人的文本生成能力(但初期未公开)GPT-32020参数规模达 1750 亿,成为主流应用和研究的标志性模子ChatGPT(基于 GPT-3.5)2022引入对话调优,使其更适应交互场景GPT-4 / GPT-4.5 / GPT-4-turbo2023–2024多模态能力(图文)、更强逻辑与对话性、上下文扩展到数十万 tokenGPT-5(传闻中)2025大概进一步强化多模态、智能体、自主学习能力 chatgpt 是怎样训练出来的? (基于奖励模子)

包含3个步调:

CASE1 : 车险反诓骗猜测



  • 使用智谱清言 ChatGLM

  • 使用cursor (网上自行搜cursor 安装教程)
    长处:生成好后,能运行
    如:帮我编写python 读取 train.csv,并展示前5行

帮我统计不同年龄层的诓骗比例,使用正确的列名

  1. import pandas as pd
  2. import numpy as np
  3. import matplotlib.pyplot as plt
  4. plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
  5. plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号
  6. # 读取数据
  7. df = pd.read_csv('train.csv')
  8. # 创建年龄段
  9. df['age_group'] = pd.cut(df['age'],
  10.                         bins=[0, 20, 30, 40, 50, 60, 100],
  11.                         labels=['0-20岁', '21-30岁', '31-40岁', '41-50岁', '51-60岁', '60岁以上'])
  12. # 计算每个年龄段的欺诈比例
  13. fraud_by_age = df.groupby('age_group').agg({
  14.     'fraud_reported': ['count', 'mean']
  15. }).round(4)
  16. fraud_by_age.columns = ['总数', '欺诈比例']
  17. fraud_by_age['欺诈数量'] = (fraud_by_age['总数'] * fraud_by_age['欺诈比例']).astype(int)
  18. # 打印结果
  19. print("\n不同年龄层的欺诈分析:")
  20. print("=" * 50)
  21. print(fraud_by_age)
  22. print("\n各年龄层详细信息:")
  23. print("-" * 50)
  24. for age_group in fraud_by_age.index:
  25.     total = fraud_by_age.loc[age_group, '总数']
  26.     fraud_count = fraud_by_age.loc[age_group, '欺诈数量']
  27.     fraud_rate = fraud_by_age.loc[age_group, '欺诈比例']
  28.     print(f"{age_group}: 总数{total}人, 欺诈{fraud_count}人, 欺诈率{fraud_rate:.2%}")
  29. # 可视化
  30. plt.figure(figsize=(12, 6))
  31. plt.bar(fraud_by_age.index, fraud_by_age['欺诈比例'])
  32. plt.title('不同年龄段的欺诈比例分析')
  33. plt.xlabel('年龄段')
  34. plt.ylabel('欺诈比例')
  35. plt.xticks(rotation=45)
  36. # 在柱状图上添加具体数值标签
  37. for i, v in enumerate(fraud_by_age['欺诈比例']):
  38.     plt.text(i, v, f'{v:.2%}', ha='center', va='bottom')
  39. plt.tight_layout()
  40. plt.savefig('fraud_by_age.png', dpi=300, bbox_inches='tight')
  41. plt.close()
  42. # 打印总体欺诈率作为参考
  43. print("\n总体欺诈率: {:.2%}".format(df['fraud_reported'].mean()))
复制代码
CASE - API 使用

获取key:通过 https://bailian.console.aliyun.com/ 完成注册,得到 dashscope的API Key,方便后续使用大模子,比如使用 Qwen-Turbo
https://bailian.console.aliyun.com/?tab=model#/api-key

   安装dashscope库时,需要关闭梯子,否则报错
  情感分析

  1. import json
  2. import os
  3. import dashscope
  4. from dashscope.api_entities.dashscope_response import Role
  5. dashscope.api_key = "sk-your key"
  6. # 封装模型响应函数
  7. def get_response(messages):
  8.     response = dashscope.Generation.call(
  9.         model='qwen-turbo',
  10.         messages=messages,
  11.         result_format='message'  # 将输出设置为message形式
  12.     )
  13.     return response
  14.    
  15. review = '这款音效特别好 给你意想不到的音质。'
  16. messages=[
  17.     {"role": "system", "content": "你是一名舆情分析师,帮我判断产品口碑的正负向,回复请用一个词语:正向 或者 负向"},
  18.     {"role": "user", "content": review}
  19.   ]
  20. response = get_response(messages)
  21. response.output.choices[0].message.content
复制代码
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

立山

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表