搜索中心

工信部:三家基础电信企业均全面接入DeepSeek开源大模型

分享至

据“工信微报”2月8日消息,中国移动、中国电信、中国联通三家基础电信企业均已全面接入DeepSeek开源大模型。工业和信息化部运行监测协调局介绍,2025年春节期间,基础电信企业力推最新AI技术普惠应用,三家基础电信企业均已全面接入DeepSeek开源大模型,实现在多场景、多产品中应用,针对热门的DeepSeek-R1模型提供专属算力方案和配套环境,助力国产大模型性能释放。

浪潮信息发布“源2.0-M32”开源大模型

分享至

5月28日消息,浪潮信息发布了“源2.0-M32” 开源大模型。该模型在源2.0系列大模型基础上,采用了“基于注意力机制的门控网络”技术,构建包含32个专家的混合专家模型(MoE),并大幅提升模型算力效率。M32凭借特别优化设计的模型架构,在仅激活37亿参数的情况下,取得了和700亿参数LLaMA3相当的性能水平,所消耗算力仅为LLaMA3的1/19。

昇腾社区回应华为发布会被指造假:是读取外部开源大模型实时生成的图片

分享至

针对网传华为发布会大模型生成图片疑人工操控的消息,昇腾社区回应:5月10日,在鲲鹏昇腾开发者大会的一场技术讨论上,演示了mxRAG SDK功能。本次演示面向开发者,展示如何通过十几行代码即可完成RAG应用开发。现场图片为实时生成,调用的是开源大模型。代码中有time.sleep(6)等表述,是命令等待读取外部开源大模型实时生成的图片,并非调取预置图片。本次展示的均为真实代码,也将在昇腾社区上开放,欢迎开发者使用并提出宝贵建议。

全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿

分享至

当地时间周四,美国科技巨头Meta推出了其最强大的开源人工智能(AI)模型Llama 3,以追赶行业领导者OpenAI。 Meta首席执行官扎克伯格声称,Llama 3有8B和70B两个版本,大版本的Llama 3将有超过4000亿参数。由于预训练和指令微调,Llama 3相比Llama 2有了极大的改进。

李彦宏再给开源大模型泼冷水,称大模型领域开源最贵

分享至

4月16日,百度AI开发者大会上,百度创始人、董事长兼首席执行官李彦宏再次表达了他对大模型开闭源之争的看法。李彦宏表示,因为有了文心4.0基础模型,可以根据需要兼顾效果、响应速度、推理成本等考虑裁减出适合各种场景的小尺寸模型。通过降维裁减出来的模型, 比直接拿开源模型调出来的模型,在同等尺寸下效果更好,在同等效果下成本明显更低。“以前说开源便宜,其实在大模型领域,开源是最贵的。所以开源模型会越来越落后。”李彦宏称。