阿里云通义千问推出开源模型Qwen-7B 成为中英文7B开源模型之最

时间：2023-08-12 来源：网络作者：网络

8月3日消息，AI模型社区魔搭ModelScope日前发布了两款开源模型，即Qwen-7B和Qwen-7B-Chat，这两款模型由阿里云证实为通义千问的70亿参数通用模型和对话模型。与此同时，阿里云也确认这两款模型均可免费使用，并支持商业应用。通过多个权威测评，Qwen-7B模型的表现远超国内外同等尺寸模型，成为当前业界最强的中英文7B开源模型。

据了解，Qwen-7B是一种支持中英文等多种语言的基座模型，其训练数据集超过2万亿个token，上下文窗口长度达到8k。而Qwen-7B-Chat则是基于Qwen-7B的中英文对话模型，已经实现了与人类认知的对齐。这两款模型的开源代码支持量化，使用户能够在消费级显卡上部署和运行模型。

这一举措使得用户无需从头开始训练模型，而是可以下载预训练好的模型并进行微调，从而快速构建高质量的模型。阿里云表示，开源大模型将有助于简化模型训练和部署过程，为用户提供更便捷的服务。

对于Qwen-7B的推出，阿里云早在今年4月便推出了自研大模型通义千问，引发市场强烈需求。此次推出小型化版本的开源模型，有望降低模型使用门槛，使大量中小企业和AI开发者更早地接触和使用通义千问。阿里云也因此成为国内首个加入大模型开源行列的大型科技企业。

用户可以直接从魔搭社区下载这两款模型，也可以通过阿里云灵积平台访问和调用它们。阿里云为用户提供了包括模型训练、推理、部署和精调等在内的全方位服务，让用户可以更轻松地应用这些先进的AI模型。

更多推荐