面完 AIGC 大模型算法岗，心态崩了。。。

商道如狼道 · 2024-8-26 02:57:16

大家好，今天我们继承聊聊 AI 科技圈发生的那些事。
内容包罗：AI 科技圈最新动态和最新面试题总结。
Meta 推新一代 SAM 2

图像识别再进化！Meta 推新一代SAM 2
官方链接：https://ai.meta.com/blog/segment-anything-2/
SAM 2 可应用于各种实际天下的用例。它支持在任何视频帧中选择和细化对象
比方，跟踪对象以创建视频效果（左）或分割从显微镜捕捉的视频中的移动细胞以帮助科学研究
SAM 2 特点总结如下：

具有快速精准的对象分割本领，可在静态图像和动态视频中轻松应对。
及时追踪对象的本领使其在视频编辑和互动媒体内容制作领域具有广泛应用前景。
具有零样本泛化本领，能精确识别和分割未经训练的对象或场景。

EchoMimic

前段时间，建国和老拜同志对唱的视频比力火，今天分享一个类似的开源项目。
EchoMimic，不但能够单独通过音频和面部标记生成人像视频，还能够通过音频和选定的面部标记相结合来生成肖像视频。

官方地址：https://badtobest.github.io/echomimic.html
EchoMimic 已在各种公共数据集和我们网络的数据集上与替代算法进行了全面比力，显示出在定量和定性评估方面的杰出性能，其他可视化和源代码访问可以位于 EchoMimic 项目页面上。
案例
AIGC 高频面试题

近来 AIGC 相关的面试题猛增，特别是爆火的LLM、多模态、扩散模型等观察的知识点越来越多。
有球友跟我反馈，上周面试了 AIGC 岗位，差点崩溃。
在这里我特别整理了一些代表性面试题，下图中的题目，你会几题？！
Diffusion

常见的采样方式以及原理？
扩散模型中添加的是高斯噪声，能否使用其他噪音的加噪方式？
怎样加速Diffusion？
DDPM和DDIM的关系？推演DDPM公式。
GAN和Diffusion的区别？
训练Stable Diffusion时为什么要使用offset Noise？
先容一下classifier-free guidance和classifier guidance的区别？
实现DDPM是否需要什么条件？
为什么DDPM加噪声的幅度不是同等的？

AIGC 高频题

过细讲从 DALLE 1 怎样发展到 DALLE 3，每个算法的核心原理，每次的创新是什么
先容MoE和变体
先容LoRA和变体
先容CLIP的模型架构与丧失函数。谈谈AE，VAE和VQ-VAE的区别。
Stable Diffusion是怎样训练的？
先容一下最新版的 SD 和 Dall-E 两者的异同。
谈谈Stable Diffusion中的交错留意力机制。
怎样改善GAN的模式坍塌？
谈谈Lora/Dreambooth/Textual Inversion, 原理以及差别。
先容一下CLIP的核心原理，模型怎么训练的？
CLIP 有哪些变体？
谈谈CLIP编码特性的优点缺点。

（完）

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

面完 AIGC 大模型算法岗，心态崩了。。。

本帖子中包含更多资源

0 个回复

快速回复

楼主热帖

标签云

浏览过的版块