ToB企服应用市场:ToB评测及商务社交产业平台

标题: [LLM+AIGC] 02.零基础DeepSeek入门初探及云端搭建详解(ChatGPT对比) [打印本页]

作者: 勿忘初心做自己    时间: 前天 18:09
标题: [LLM+AIGC] 02.零基础DeepSeek入门初探及云端搭建详解(ChatGPT对比)
比年来,人工智能技术火热发展,尤其随着ChatGPT和DeepSeek被提出,其可以或许基于在预训练阶段所见的模式、统计规律和知识来生成回答,还能根据谈天的上下文进行互动,真正像人类一样来谈天交流以及完成复杂的NLP使命。基于此,为更好地学习前沿AI知识,相识LLM和AIGC应用实战,本人开启了《LLM+AIGC》专栏,一方面作为在线笔记记录和分享自己的学习过程,另一方面期望帮助更多初学者以及对LLM感爱好的同学。知识无价人有情,盼望我们都能在人生路上开心快乐、共同发展。
该系列紧张涵盖三方面:

前一篇文章普及了ChatGPT应用场景,简单先容什么是大语言模型(LLM)和人工智能生成内容(AIGC)。这篇文章将带领各人探索DeepSeek,并尝试在云端搭建,与ChatGPT 4o进行简单对比。基础性文章,盼望对初学者有所帮助!且看且珍惜,加油 O(∩_∩)O


  
前文赏析:


一.什么是DeepSeek

Deepseek(中文名:深度求索) 是一种基于深度学习技术的智能搜刮和信息检索体系,是一款由杭州深度求索人工智能基础技术研究有限公司开发的大规模预训练语言模型。它通过模拟人类认知过程,利用神经网络模型对大量数据进行处置处罚和分析,从而实现对复杂查询的高效相应。Deepseek的核心在于其可以或许理解自然语言查询的语义,并从海量数据中提取出最相关的信息。它的英文名“DeepSeek”可以读作“深思”(Deep)和“探索”(Seek),寓意着通过深度学习技术探索未知的领域。

   接下来,作者将结合DeepSeek和ChatGPT,分别对它们进行描述,读者可以比较两种常用大模型生成的结果。譬如:
  
  官网地点如下:



1.DeepSeek基本原理

首先,给出DeepSeek官网对其的描述,Deepseek的基本原理建立在深度学习的基础之上,紧张包括以下几个关键步骤:


接下来,给出ChatGPT的描述。DeepSeek的核心原理基于大规模自回归或自编码预训练,其紧张头脑包括:

DeepSeek 采取自回归(Autoregressive)方式进行文本生成,即通过给定前缀推测下一个 token,从而生成符合语法及语义逻辑的完整文本。


2.实现过程

DeepSeek官网给出的实现过程:


ChatGPT官网给出的实现过程。DeepSeek 的实现流程紧张包括数据预备、模型训练、优化与微调,详细步骤如下:

末了,推荐各人阅读DeepSeek相关论文,后续作者也尝试分享。



同时推荐木尧老师的分享,其总结了三个核心模型,各人可以去学习。原文地点如下:




3.初学者使用建议

DeepSeek官网给出的初学者使用建议:

通过以上步骤,初学者可以渐渐把握Deepseek的原理和实现方法,并可以或许应用于实际的信息检索使命中。
下面事ChatGPT给出的初学者怎样使用 DeepSeek。对于初学者而言,可以按照以下步骤使用 DeepSeek 进行文本处置处罚使命:
(1)安装 DeepSeek 相关依赖
DeepSeek 通常基于 PyTorch 或 TensorFlow 进行训练和推理,可以通过以下方式安装:
  1. pip install transformers torch deepseek
复制代码
(2)加载预训练模型
DeepSeek 的模型通常托管在 Hugging Face Transformers,可以使用 AutoModel 进行加载:
  1. from transformers import AutoModelForCausalLM, AutoTokenizer
  2. # 加载 DeepSeek 预训练模型
  3. model_name = "deepseek-ai/deepseek-llm"
  4. tokenizer = AutoTokenizer.from_pretrained(model_name)
  5. model = AutoModelForCausalLM.from_pretrained(model_name)
  6. # 设定设备
  7. device = "cuda" if torch.cuda.is_available() else "cpu"
  8. model.to(device)
复制代码
(3)进行文本生成
使用 generate() 方法进行文本生成:
  1. input_text = "人工智能的未来发展方向包括"
  2. input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to(device)
  3. # 生成文本
  4. output = model.generate(input_ids, max_length=100)
  5. generated_text = tokenizer.decode(output[0], skip_special_tokens=True)
  6. print("DeepSeek 生成的文本:", generated_text)
复制代码
(4)在特定使命上进行微调
如果盼望在特定领域(如法律、医学、金融)优化 DeepSeek,可进行微调:
  1. from transformers import Trainer, TrainingArguments
  2. training_args = TrainingArguments(
  3.     output_dir="./deepseek_finetuned",
  4.     per_device_train_batch_size=4,
  5.     num_train_epochs=3,
  6.     save_steps=500,
  7.     logging_dir="./logs",
  8. )
  9. trainer = Trainer(
  10.     model=model,
  11.     args=training_args,
  12.     train_dataset=custom_dataset
  13. )
  14. trainer.train()
复制代码


二.DeepSeek注册及尝试

1.DeepSeek初试

DeepSeek注册非常简单,通过手机或微信、邮箱即可登录。

登录之后,DeepSeek谈天界面提供了三种模式:


(1)基础模式
好比我们简单利用DeepSeek进行搜刮,其默认使用基础模型,但该问题未给出详细答案。该模式依赖预训练知识库,回答速度更快,但无法获取最新信息,更适合解决通用知识类问题,且适合初学者解决一些常见问题。

(2)深度思考模式
为让其回答更准确、全面,并具有更好的逻辑性,我们尝试开启深度思考。看看DeepSeek是否能找出“谁是Eastmount”。可以发现深度思考成功识别。


(3)联网搜刮模式
接着,我们又尝试联网搜刮,该模式通常用于实时联网搜刮,结合最新的网络及搜刮信息,给出更全面准确的答案,适合需要获取最新信息的场景。给出的内容更为准确,由于其从互联网中找到了28个紧张的网页描述。
   DeepSeek 联网搜刮模式总结:
Eastmount是一位技术实力深厚、乐于分享的博主,他的博客内容涵盖广泛,适合差别条理的学习者。如果你是初学者,可以从他的Python和网络安全专栏入手;如果你对AI安全或深度学习感爱好,他的PyTorch和AI安全系列也是不错的选择。
  

别的,近来比较火的是DeepSeek可以模拟差别名人的风格撰写诗歌。

并且点击按钮可以上传文件进行问答,相关功能后续博客详细探索。


2.DeepSeek vs ChatGPT 4o

下面我们分别比较DeepSeek vs ChatGPT 4o,结合一个初学者经常问的问题来探索,并对比它们的效果。同时,该问题对初学者也非常有帮助。
   提示词
我是一名编程初学者,紧张想利用ChatGPT辅助学习Python机器学习,请告知我怎样利用ChatGPT来进行学习,并给出相关的案例。
  (1)DeepSeek 基础模型

生成内容如下:

作为一名编程初学者,利用Deepseek辅助学习Python机器学习是一个非常有前景的方向。Deepseek可以帮助你快速找到相关的学习资源、代码示例、教程息争决方案。以下是怎样利用Deepseek进行学习的步骤和相关案例:
① 利用Deepseek查找学习资源
步骤:

案例:

② 利用Deepseek查找代码示例
步骤:

案例:

③ 利用Deepseek解决问题
步骤:

案例:

④ 利用Deepseek进行项目实践
步骤:

案例:

⑤ 连续学习与优化
步骤:

案例:

通过以上步骤,你可以有用地利用Deepseek辅助学习Python机器学习,渐渐提升自己的编程和机器学习技能。盼望这些建议对你有所帮助,祝你在学习过程中取得丰硕的成果!

(2)ChatGPT 4o

生成内容如下:

作为一名 编程初学者,利用 ChatGPT 来学习 Python 机器学习 是一个非常高效的方法。ChatGPT 可以帮助你:

① ChatGPT 辅助 Python 机器学习学习路径





欢迎光临 ToB企服应用市场:ToB评测及商务社交产业平台 (https://dis.qidao123.com/) Powered by Discuz! X3.4