6月6日,阿里开源通义千问3全新的向量模型系列Qwen3-Embedding(简称千问3向量模型)。该模型以千问3为底座,专门为文本表征、检索和排序等核心任务进行优化训练,性能较上一版本可提升40%,在MTEB等权威专项榜单中超越了谷歌、OpenAI、微软等公司的顶尖模型。
Qwen3-Embedding 系列模型
向量模型像是AI的“翻译器”,它可以将文本、图片等人类可认知的非结构化信息,映射到机器更易理解的向量空间,再基于这些向量实现高效的信息分类、检索或排序。也正因此,向量模型对于提升AI的语义理解、信息检索、多模态融合等核心能力至关重要。基于千问3模型,通义团队通过对比训练、SFT、模型融合等方法,打造出全新的千问3向量模型,包含文本嵌入模型 Qwen3-Embedding以及文本排序模型Qwen3-Reranker。
千问3向量模型系列训练过程图
相较于上一个版本,千问3向量模型在文本检索、聚类、分类等核心任务上提升最高40%以上的性能。同时,得益于千问3的多语言能力,千问3向量模型系列率先支持超100种语言,并涵盖多种编程语言,可实现强大的多语言、跨语言及代码检索能力。
为方便开发者,此次有9款千问3向量模型开源,涵盖0.6B、4B、8B等不同尺寸及GGUF版本。开发者可从中找到最符合需求的模型,自由组合模块,还可自定义向量或指令,实现特定任务、语言和场景的深度优化。比如,开发者可在智能搜索、推荐系统中采用Qwen3-Embedding作文本向量化,或者在RAG实践中用Qwen3-Reranker提升最终结果的相关性和准确性,甚至与视觉理解模型结合,探索前沿的跨模态语义理解。
目前,千问3 Embedding和Reranker模型均已在魔搭社区、Hugging Face和GitHub等平台上开源,开发者也可直接通过阿里云百炼使用API服务。
https://www.news.cn/tech/20250606/5bc9adcc3c2146d192d1b19a44c201eb/c.html
版权及免责声明:
1、凡本网来源注明“中国社会新闻网”(shehuinews.com)的所有文章和图片作品,版权均属于“中国社会新闻网”(shehuinews.com),未经本网授权,任何单位及个人不得转载、摘编或以其它方式使用上述作品。已经本网授权使用新闻稿件和图片作品的,应在授权范围内使用,并注明“来源:中国社会新闻网(shehuinews.com)”。违反上述声明者,本网将追究其相关法律责任。
2、凡本网注明 “来源:XXX(非中国社会新闻网shehuinews.com)”的文章和图片作品,系我方转载自其它网站,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。
3、如因稿件和图片作品的内容、版权和其它问题需要同本网联系的,请在15个工作日内告知我方。
4、联系方式:中国社会新闻网”(shehuinews.com)电话:400-8059-268 电子邮件:450952431@qq.com
版权及免责声明:本网所转载信息,不代表“中国社会新闻网”(shehuinews.com)的观点,凡本网注明“来源:中国社会新闻网”的所有作品,均为中国社会新闻网合法拥有版权或有权使用的作品。未经许可或明确书面授权,任何人不得复制、转载、摘编、修改、链接中国社会新闻网内容,违反上述声明者,我们将依法追究其相关法律责任。