2月7日,据研究公司 SimilarWeb估计,在短短一周内,DeepSeek网站的用户数量就超过了谷歌的 Gemini 聊天AI(后者已经存在了近两年)。1月31日,DeepSeek.com在美国的日访问量为240万次,比Gemini网站(150万次)高出 60%。OpenAI 的ChatGPT仍然是其八倍,当天的日访问量为1930万次。(DeepSeek 在1月28日的访问量达到490万次的峰值。)DeepSeek和Gemini之间的差距在美国以外更大:SimilarWeb的数据显示,1月31日,这个中国聊天AI在全球(基本不包括中国)的访问量为2920万次,是Gemini的三倍多。
2月6日消息,谷歌周三向所有人发布了 Gemini 2.0——号称迄今为止功能最强大的人工智能模型套件。去年 12 月,该公司向开发人员和受信任的测试人员开放了访问权限,并将一些功能整合到谷歌产品中,但谷歌表示,这是一次全面发布。该模型套件包括 2.0 Flash,被称为主力模型,最适合大规模高容量、高频率任务,以及 2.0 Pro Experimental 用于编码性能,以及 2.0 Flash-Lite,该公司称其为迄今为止最具成本效益的模型。
北京时间1月20日11时54分,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。
1月9日消息,今天凌晨,微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen 2.5 -14B和Llama-3.3-70B。在美国数学竞赛AMC的测试中phi-4更是达到了91.8分,超过了Gemini Pro 1.5、GPT-4o、Claude 3.5 Sonnet、Qwen 2.5等知名开闭源模型,甚至整体性能可以与4050亿参数的Llama-3.1媲美。
12月31日,山姆·奥特曼公布了2025年OpenAI即将发布的技术产品,包括通用人工智能AGI、智能体更好的GPT-4o升级版、更好的记忆存储、更好的上下文窗口成人模式、深度研究特色功能更好的Sora更好的个性化定制等。
近日,亮道智能正式面向全球市场推出Flash纯固态激光雷达产品——Gen2 Mini。据介绍,Gen2 Mini实现了体积上的大幅缩减,面向无人机、人形机器人、智慧安防等多领域的客户,提供快速集成部署方案,提升智能化设备整体的紧凑性。
当地时间12月11日,谷歌宣布推出最新AI模型Gemini 2.0,称这是其迄今为止最强大的模型。即日起,谷歌将2.0开放给开发者以及受信任的测试人员,并正在积极推进将其整合到公司的产品中,率先从Gemini和Search开始。即日起,Gemini 2.0 Flash体验版模型将对所有Gemini用户开放。同时,谷歌还推出了Deep Research的新功能,它运用高级推理和长上下文处理能力,承担研究助手的角色,帮助用户探索复杂的主题并撰写报告。该功能自即日起对Gemini Advanced用户开放。
9月13日消息,从多名独立信源处获悉,中国大模型独角兽MiniMax产品负责人、前今日头条用户产品负责人张前川,因个人原因目前已淡出公司事务,改任产品顾问一职。对上述消息,MiniMax回应:确认属实,我们很感谢前川的付出和努力。张前川曾就职于百度搜索和知乎。2016年,他加入字节跳动,做过小游戏类产品,后任今日头条用户产品团队负责人。2023年初,张前川离职后,曾宣称创业做AI应用层公司,后加入MiniMax。
近日,李飞飞团队提出了关系关键点约束(ReKep/Relational Keypoint Constraints)。简单来说,该方法就是将任务表示成一个关系关键点序列。并且,这套框架还能很好地与 GPT-4o 等多模态大模型很好地整合。从演示视频来看,这种方法的表现相当不错。该团队也已发布相关代码。李飞飞表示,该工作展示了视觉与机器人学习的更深层次融合。虽然论文中没有提及李飞飞在今年 5 年初创立的专注空间智能的 AI 公司 World Labs,但 ReKep 显然在空间智能方面大有潜力。
当地时间8月20日,美国开放人工智能研究中心(OpenAI)宣布推出GPT-4o微调自定义版本,即日起对所有付费使用级别开发人员开放。开发人员可以使用自定义数据集对GPT-4o进行微调,从而针对特定用例以更低的成本获得更高的性能。OpenAI表示,微调模型完全在客户的控制之下,拥有业务数据的全部所有权,可以确保数据永远不会被共享或用于训练其他模型。
OpenAI当地时间7月18日推出名为“GPT-4o mini”的迷你AI模型,该模型是GPT-4o的一个分支。OpenAI计划稍后将图像、视频和音频集成到其中。
OpenAI联合创始人兼首席执行官山姆·奥特曼当地时间5月15日就GPT-4o说明称,尽管GPT-4o的文本模式已经发布,但语音模式还未发布。
北京时间5月14日凌晨,OpenAI再迎重磅更新,虽然不是AI搜索,也不是GPT-5,而是发布了新旗舰模型GPT-4o,但也足以让业内震撼。 在此次OpenAI 仅有26分钟的春季发布会中,OpenAI首席技术官穆里·穆拉提(Muri Murati)宣布推出名为GPT-4o的新旗舰生成式AI模型,其集文本音频视觉于一身,能力全新升级。 此前不少爆料提到,OpenAI将推出AI搜索,与谷歌搜索竞争,从而增强ChatGPT的功能并开拓新市场,并称这款产品将在谷歌本周的开发者大会前推出。 不过,OpenAI CEO山姆·奥特曼对此否认,其表示,“不是 GPT-5,也不是搜索引擎,但我们一直在努力开发一些我们认为人们会喜欢的新东西!对我来说就像魔法一样。” GPT-4o显然就是奥特曼所说的“像魔法一样”的新东西。GPT-4o中的o就是Omni,其是拉丁语词根,意思是全面、全能,奥特曼称其“最好的模型”,并免费开放。
3月4日消息,据知情人士处消息,通用大模型初创项目MiniMax正在进行新一轮大规模融资,阿里为其中的核心领投方。截至发稿,MiniMax及阿里方面均未回复。此前,MiniMax已完成3轮融资,投资方包括腾讯、米哈游等。 据介绍,MiniMax成立于2021年12月,由商汤科技前副总裁、商汤研究院副院长闫俊杰等人创办,正研究类似于ChatGPT的人工智能解决方案。 2023年3月,MiniMax发布面向B端用户的大语言模型技术平台——“MiniMax开放平台”。
当地时间2月21日,谷歌在社交平台X上发布声明称,该公司意识到其Gemini人工智能产品在一些历史图像生成描述中存在不准确之处,其正在努力改善这一问题。谷歌表示,“我们意识到Gemini在某些历史图像生成描述中存在不准确之处。Gemini的AI图像生成功能的确可以生成各类的人。这通常是件好事,因为世界各地的人们都在使用它。但它在这里失误了。”
12月14日消息,美国时间周三,谷歌发布了面向企业的Gemini Pro,允许开发者利用谷歌最新的人工智能模型构建应用程序。Gemini是一个通过大量数据训练的大型人工智能系统,可以根据用户的要求生成新内容。
外界期待已久的谷歌大语言模型Gemini在美国时间12月6日早间正式对外发布,谷歌首席执行官皮查伊表示,Gemini 1.0是目前为止谷歌能力最强的通用人工智能模型。谷歌当天发布的Gemini 1.0共分为Ultra, Pro和Nano三个版本,其中Ultra的能力最强,复杂度最高,能够处理最为困难的任务,Pro能力稍弱,可以用来处理多任务,Nano则更注重于端侧的处理能力。
本轮投资方为穗开投资、广州产投资本、超高清视频产业投资基金、博原资本、华智兴瑞基金、新景富盈基金、珂玺资本,老股东普华资本增持。