[240607] Jina AI 发布多模态嵌入模子 | PHP 曝新毛病 | TypeScript 5.5 RC ...

鼠扑  论坛元老 | 2024-6-21 13:03:37 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 1036|帖子 1036|积分 3108

Jina AI 多模态嵌入模子 - jina-clip-v1

jina-clip-v1 是 Jina AI 最新推出的多模态嵌入模子。与 OpenAI CLIP 相比,它大幅提升了纯文本检索方面的性能,同时在文本图像跨模式检索等方面也有所提升。

  • 模子信息:

    • jina-clip-v1 沿用了 OpenAI CLIP 的模式: 共同训练文本和图像模子并在同一嵌入空间中生成输出。
    • 在文本编码方面,它采用了 Jina BERT v2 架构,该架构能支持 8k token 输入和 768 维向量输出,比 OpenAI CLIP 模子支持的 77 token 输入要高 100 多倍。
    • 在图像嵌入方面,它使用了北京人工智能研究院的 EVA-02 模子。在实际测试中,该模子的体现明显优于其他同类模子。
    • 在模子训练方面,Jina 采用新的多任务对比训练方法来训练 jina-clip-v1 模子。

  • 性能评估:   ModelText-TextText-to-ImageImage-to-TextImage-Imagejina-clip-v10.4290.8990.8030.916openai-clip-vit-b160.1620.8810.7560.816vs OpenAI CLIP165%2%6%12%
  • 价格: 文本和图像的输入均按 token 消耗收费。对于英文文本,平均每个单词必要 1.1 token。对于图像,平均每张 750x500 像素的图片必要 12000 token(具体的计算细节请参考 Jina 官方)。
  • 使用方法:

    • 下载模子: jina-clip-v1 模子已开源,可以在 Hugging Face 上免费获取,其开源协议为 Apache 2.0。
    • API: 支持通过 Jina Embeddings API 将 jina-clip-v1 集成到你的应用程序中。
    • LLM 框架: jina-clip-v1 已集成到 LlamaIndex 和 LangChain。

  • 支持的语言: 如今仅支持英语,下一步计划支持德语和中文。
PHP 毛病 CVE-2024-4577

CVE-2024-4577:PHP CGI 参数注入毛病摘要
毛病描述:


  • PHP 在 Windows 操作体系上的编码转换实现中存在缺陷,攻击者可利用此缺陷绕过 CVE-2012-1823 的防护措施。
  • 攻击者可通过构造特殊的字符序列,向远程 PHP 服务器发起参数注入攻击,终极导致任意代码执行。
受影响版本:


  • PHP 8.3 < 8.3.8
  • PHP 8.2 < 8.2.20
  • PHP 8.1 < 8.1.29
  • 所有安装在 Windows 操作体系上的 PHP 版本
毛病影响:


  • 攻击者可在受影响的服务器上远程执行任意代码。
  • 默认情况下,所有版本的 XAMPP for Windows 安装都容易受到攻击。
  • 毛病利用的难易程度取决于 Windows 操作体系的语言环境,已知在繁体中文、简体中文和日语环境下可直接执行任意代码。
缓解措施:


  • 强烈建议所有效户升级到最新版本的 PHP:8.3.8、8.2.20 和 8.1.29。
  • 对于无法升级的体系,可参考文章中提供的临时缓解措施,例如使用 Rewrite Rules 制止攻击。
  • 建议评估将 PHP CGI 架构迁徙到更安全的架构,例如 Mod-PHP、FastCGI 或 PHP-FPM。
其他信息:


  • DEVCORE 已将该毛病报告给 PHP 官方团队,并于 2024 年 6 月 6 日发布了修复补丁。
  • 文章中提供了详细的技能细节、毛病利用场景、缓解措施和时间线等信息。
数据支持:


  • CVE 编号:CVE-2024-4577
  • 受影响软件:PHP
  • 毛病类型:参数注入
  • 严重程度:严重
  • CVSS 评分:待定
  • 披露时间:2024 年 6 月 6 日
  • 参考资料:

    • PHP 安全公告:https://github.com/php/php-src/security/advisories/GHSA-3qgc-jrrr-25jv
    • MS-UCODEREF:https://learn.microsoft.com/en-us/openspecs/windows_protocols/ms-ucoderef/d1980631-6401-428e-a49d-d71394be7da8
    • CERT/CC VU#520827:https://www.kb.cert.org/vuls/id/520827

以上文章采用 Gemini Pro 1.5 生成摘要,命令如下:
  1. x jina r 'https://devco.re/blog/2024/06/06/security-alert-cve-2024-4577-php-cgi-argument-injection-vulnerability-en/' | \
  2.   @gemini -t 0 '以大纲方式生成一份摘要,列举更多的数据支撑,用中文'
复制代码
TypeScript 5.5 RC 发布公告

主要更新:


  • 类型推断改进

    • 自动推断类型谓词,例如 xxx is number,以得到更准确的推断署名。
    • 优化常量索引访问类型判断,例如当 obj 和 key 都是常量时,TypeScript 能够更精准判断 obj[key] 的类型。
    • 优化变量追踪类型变化的准确性,例如数组使用 .filter 显示过滤后,TypeScript 能够更准确地推断出数组类型。

  • JSDoc 类型导入

    • 支持使用 @import 语法在 JSDoc 中导入类型,方便开辟者在 JavaScript 文件中直接导入类型,开启类型检查。

  • 正则表达式基本语法检查

    • 新增对正则表达式语法的基本检查,例如捕获组引用错误。

  • 支持 ECMAScript Set 新函数的类型声明

    • 支持 Set 类型函数的类型推断,如 union 、intersection 与 isSubsetOf 等。

  • 隔离声明

    • 新增 --isolatedDeclarations 选项,可从源文件自动生成库和模块轻量级类型署名。

  • 其他改进:

    • 新增 ${configDir} 模板变量,用于在设置文件 tsconfig.json 中使用相对路径,这使得跨项目共享设置文件变得更加容易,并确保设置文件更加可移植。
    • 在生成声明文件时,会参考 package.json 中的依靠关系。
    • 编辑器和监听模式的可靠性改进。
    • 性能和体积优化。
    • 更方便地从 ECMAScript 模块中使用 API。
    • 新增 transpileDeclaration API,用于编译生成单个 TypeScript 文件。

泉源:

https://devblogs.microsoft.com/typescript/announcing-typescript-5-5-rc/

   更多内容请查阅 : blog-240607
  
关注微信官方公众号 : oh my x

获取开源软件和 x-cmd 最新用法


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

鼠扑

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表