北京时间1月20日11时54分,OpenAI发布事故报告指出,当前遭遇GPT-4o和4o-mini模型性能下降问题,目前正在进行调查,并将尽快发布最新消息。
1月9日消息,今天凌晨,微软研究院开源了目前最强小参数模型——phi-4。去年12月12日,微软首次展示了phi-4,参数只有140亿性能却极强,在GPQA研究生水平、MATH数学基准测试中,超过了OpenAI的GPT-4o,也超过了同类顶级开源模型Qwen 2.5 -14B和Llama-3.3-70B。在美国数学竞赛AMC的测试中phi-4更是达到了91.8分,超过了Gemini Pro 1.5、GPT-4o、Claude 3.5 Sonnet、Qwen 2.5等知名开闭源模型,甚至整体性能可以与4050亿参数的Llama-3.1媲美。
12月31日,山姆·奥特曼公布了2025年OpenAI即将发布的技术产品,包括通用人工智能AGI、智能体更好的GPT-4o升级版、更好的记忆存储、更好的上下文窗口成人模式、深度研究特色功能更好的Sora更好的个性化定制等。
由于计算成本居高不下,加上高质量训练数据的稀缺,OpenAI在推进GPT-5的开发进程上正落后于原定计划。截至目前,OpenAI的GPT-5开发进度落后半年,训练成本高达5亿美元。OpenAI已至少对GPT-5实施了两轮大规模训练,旨在借助海量数据资源来优化模型效能。
OpenAI的首席执行官Sam Altman在周四透露,由于计算能力的限制,公司无法按预期频率推出新产品。他解释称,随着AI模型变得日益复杂,公司难以同时处理众多项目,尤其是在计算资源分配上面临挑战。
微软亚研院前首席研究经理谭旭于8月加入大模型创业公司月之暗面,主要负责研发端到端语音模型。谭旭加入后,主要目标之一是可能是帮月之暗面打造类似GPT-4o的语音体验。
近日,李飞飞团队提出了关系关键点约束(ReKep/Relational Keypoint Constraints)。简单来说,该方法就是将任务表示成一个关系关键点序列。并且,这套框架还能很好地与 GPT-4o 等多模态大模型很好地整合。从演示视频来看,这种方法的表现相当不错。该团队也已发布相关代码。李飞飞表示,该工作展示了视觉与机器人学习的更深层次融合。虽然论文中没有提及李飞飞在今年 5 年初创立的专注空间智能的 AI 公司 World Labs,但 ReKep 显然在空间智能方面大有潜力。
当地时间8月20日,美国开放人工智能研究中心(OpenAI)宣布推出GPT-4o微调自定义版本,即日起对所有付费使用级别开发人员开放。开发人员可以使用自定义数据集对GPT-4o进行微调,从而针对特定用例以更低的成本获得更高的性能。OpenAI表示,微调模型完全在客户的控制之下,拥有业务数据的全部所有权,可以确保数据永远不会被共享或用于训练其他模型。
OpenAI当地时间7月18日推出名为“GPT-4o mini”的迷你AI模型,该模型是GPT-4o的一个分支。OpenAI计划稍后将图像、视频和音频集成到其中。
7月2日消息,日前,OpenAICEO 山姆・奥特曼在谈及GPT-5时形容称其“神奇”。他透露,GPT-5的开发还需要时间,目前处于早期阶段,尚不清楚发布日期,但将是“巨大飞跃”。CTO Mira Murati 预计GPT-5将在2025年底或2026年初推出,达到博士级智能水平,标志人工智能技术可能迎来又一次重大飞跃。
GPT-5 延期上周,OpenAI CTO 米拉·穆拉蒂(Mira Murati)在一次访谈中表示,大约在一年半后,也就是 2025 年底或 2026 年初,GPT 可以在特定任务上达到博士的智能。这被视为是 GPT-5 的发布时间。 在访谈中,穆拉蒂将 GPT-3 类比为幼儿,GPT-4 等同于聪明的高中生,而 GPT-5 将实现质的提升,达到博士水平。微软 CTO 凯文·斯科特(Kevin Scott)最近也提出相似看法,认为下一代大模型将具备更强的记忆和推理功能,足以应对博士学位考试。 在此之前,OpenAI CEO 阿尔特曼就试图不断释放关于 GPT-5 的消息。他暗示第五代 GPT 可能会是重大的转折点,预计 GPT-5 和 GPT-4 的差距将与 GPT-4 相比 GPT-3 的进步一样显著。他一直不透露具体细节和时间表。
自英国计算机科学家阿兰.图灵于1950年提出关于判断机器是否能够思考的著名试验“图灵测试”以来,该测试就被视为判断计算机是否具有模拟人类思维能力的关键。两位研究人员以真人、初代聊天机器人ELIZA、GPT-3.5和GPT-4为研究对象,试图了解谁在诱使人类参与者认为它是人类方面表现最成功。结果显示,多达54%的参与者将GPT-4误认为真人,是迄今为止首次有AI模型以如此高的结果通过图灵测试。
5月17日消息,腾讯集团副总裁蒋杰在腾讯云生成式AI产业应用峰会上表示,腾讯混元大模型目前整体性能已居国内第一梯队,部分中文能力已追平GPT-4。在生视频能力上,腾讯混元可16s 完成视频生成。在生3D层面,腾讯混元已布局文/图生3D,单图仅需30秒即可生成3D模型。
OpenAI联合创始人兼首席执行官山姆·奥特曼当地时间5月15日就GPT-4o说明称,尽管GPT-4o的文本模式已经发布,但语音模式还未发布。
北京时间5月14日凌晨,OpenAI再迎重磅更新,虽然不是AI搜索,也不是GPT-5,而是发布了新旗舰模型GPT-4o,但也足以让业内震撼。 在此次OpenAI 仅有26分钟的春季发布会中,OpenAI首席技术官穆里·穆拉提(Muri Murati)宣布推出名为GPT-4o的新旗舰生成式AI模型,其集文本音频视觉于一身,能力全新升级。 此前不少爆料提到,OpenAI将推出AI搜索,与谷歌搜索竞争,从而增强ChatGPT的功能并开拓新市场,并称这款产品将在谷歌本周的开发者大会前推出。 不过,OpenAI CEO山姆·奥特曼对此否认,其表示,“不是 GPT-5,也不是搜索引擎,但我们一直在努力开发一些我们认为人们会喜欢的新东西!对我来说就像魔法一样。” GPT-4o显然就是奥特曼所说的“像魔法一样”的新东西。GPT-4o中的o就是Omni,其是拉丁语词根,意思是全面、全能,奥特曼称其“最好的模型”,并免费开放。
OpenAI当地时间5月10日宣布,将于太平洋时间5月13日上午10点举行直播,演示ChatGPT和GPT-4的部分更新。 OpenAI首席执行官山姆·奥特曼在社交媒体平台X发文称,此次更新无关GPT-5和搜索引擎,“但我们一直在努力开发一些我们认为人们会喜欢的新东西!对我来说,感觉就像魔法一样”。
4月25日,OpenAI联合创始人兼首席执行官萨姆.奥尔特曼(Sam Altman)在斯坦福大学发表演讲,提及AGI(通用人工智能)发展、OpenAI的迭代节奏等。有消息称,这场演讲在英伟达礼堂进行,超一千人在门口排队,热度颇高。"GPT-5会更加智能,这将是历史上最令人瞩目的事件之一。"在一段流出的视频中,奥尔特曼表示,以高度的科学确定性来说,GPT-5将比GPT-4智能很多,GPT-6将比GPT-5智能很多,而我们远未触及极限。 此前OpenAI已推出GPT-3.5和GPT-4。对于OpenAI的产品迭代,奥尔特曼认为尽早且频繁推出AI产品,保持迭代部署非常重要,即便现在看来ChatGPT还有点令人尴尬,GPT-4还显得愚蠢。要让社会为技术进步做好准备,依赖于迭代部署。
4月12日消息,OpenAI在社交平台X宣布,新GPT-4 Turbo模型现已可供付费ChatGPT用户使用。OpenAI表示,其提升了该模型写作、数学、逻辑推理和编码的能力。据OpenAI介绍,GPT-4 Turbo现已在ChatGPT Plus、Team、Enterprise和API中可供使用。
据曝料,微软工程师透露,为训练GPT-6,已建立了10万个H100训练集群,但不幸的是,这一举动导致整个电网崩溃。工程师表示,团队在部署跨区域GPU间的infiniband级别链接时遇到了困难。 工程师解释称,原计划在同一地区部署超过100,000个H100 GPU,但这样一来电网负荷将无法承受而发生崩溃。此举导致GPT-6训练计划受阻,揭露出通往AGI大关,还需要解决电力难题的困境。 而此前,GPT-5的训练已经展开,据称陷入了瓶颈,直接跳过GPT-4.5版本,而GPT-6已在紧锣密鼓地进行训练。但即便如此,GPT-5也并非AGI,因为其无法解决「量子引力」问题。而GPT-6也同样无法达到AGI水平。 值得注意的是,整个训练过程中约有90%的数据集为合成数据,以弥补现有数据的不足。然而,电力短缺限制了未来GPU的发展,可能使得未来AI发展受限。因此,人工智能面临着重大的能源问题,未来可能需要寻找新的能源解决方案。