3月12日消息,原字节跳动AI大将、火山引擎AI应用产品线一号位骆怡航已于近日加入生数科技,担任CEO一职,将全面负责公司研发、产品、商业化及团队管理工作。
3月10日,字节豆包大模型团队官宣开源一项针对MoE架构的关键优化技术,可将大模型训练效率提升1.7倍,成本节省40%。据了解,该技术已实际应用于字节的万卡集群训练,累计帮助节省了数百万GPU小时训练算力。
3月10日消息,报道称,开发出Manus的中国创业公司——Monica,在2024年年初曾经与字节进行过一轮收购谈判。当时字节出价3000万美金,但因为远远达不到创始人肖弘的心理价位,这次谈判最终不欢而散。接近Monica内部的从业者表示,字节收购的逻辑是以3000万美金的价格收购团队,将其团队和产品整合到豆包体系中,但是Monica进入字节后就会跟字节大模型战略绑定,就丧失了Monica产品上的独特优势。这也是肖弘及其团队不看好这场收购的主要原因。Monica的最新融资于2024年年底close,目前公司估值接近一亿美元。
3月7日消息,有消息称,近日,字节跳动在内部发布了反腐通报。2024年全年,字节跳动共辞退违规员工353人,移交司法机关追究刑事责任39人。3月7日,字节跳动的相关负责人向记者证实,相关数字属实。另外,从知情人士处获悉,该通报名为《企业纪律与职业道德委员会通报》,发布时间为3月6日下午。
3月5日消息,据路透社报道,两位知情人士周二透露,字节跳动在本周启动了针对美国员工的新一轮股票回购计划,估值超过了六个月前的水平。知情人士称,字节跳动对其美国员工表示,将以每股189.90美元的价格回购股票,比一年前的171美元回购价上涨11%,也高于六个月前的181美元。按照最新股票回购价计算,字节跳动的估值将增至大约3150亿美元,显示出这家全球最有价值的未上市公司之一正从2023年的估值下滑中恢复。
据字节跳动技术团队微信公众号3月3日消息,字节跳动宣布中国首个AI原生集成开发环境(AI IDE)Trae国内版正式上线,配置Doubao-1.5-pro,并支持切换满血版DeepSeek R1、V3模型。据介绍,Trae国内版不仅针对中国开发场景和习惯进行了一些优化,后续还即将支持模型自定义,用户可以根据自己的喜好,接入合适的大模型API。
2月25日消息,字节跳动旗下AI助手豆包正在小范围测试深度思考模型,但接入的不是DeepSeek模型。据豆包相关负责人表示,当前测试的是自己深度思考模型的不同实验版本。实测发现,在豆包对话页面暂未显示“深度思考”功能的入口,但被灰度到的用户在询问不同问题后,豆包生成的答复中会显示思维链。
2月21日消息,有市场消息称,在原谷歌DeepMind副总裁吴永辉加入字节担任大模型团队Seed基础研究负责人后,字节大模型团队进行架构调整,多名原来向朱文佳汇报的算法和技术负责人转向吴永辉汇报。对此,接近字节人士表示,吴永辉主要负责AI基础研究探索工作,偏基础研究,朱文佳主要负责模型应用相关的工作,偏模型应用,两个人都在seed部门,都向字节CEO梁汝波汇报。
2月17日,据知情人士透露,在谷歌工作长达17年的“Google Fellow”吴永辉博士已离开谷歌,加入字节跳动。吴永辉在字节跳动将担任大模型团队Seed基础研究负责人,专注大模型基础研究探索、AI for science等偏长期的研究探索工作,汇报给字节跳动CEO梁汝波。知情人士称,吴永辉离开谷歌,是希望做一些新的,偏探索的工作。这次加盟字节,也将专注在偏长期、偏基础的科研工作。
据豆包大模型团队消息,字节跳动豆包大模型Foundation团队近期提出UltraMem,一种同样将计算和参数解耦的稀疏模型架构,在保证模型效果的前提下解决了推理的访存问题。据介绍,该架构有效解决了MoE推理时高额的访存问题,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%。
1月23日,据媒体报道,字节豆包大模型团队已在内部组建AGI长期研究团队,代号“Seed Edge”,鼓励项目成员探索更长周期、不确定的和大胆的AGI研究课题。接近字节的知情人士透露,Seed Edge的目标是探索AGI的新方法,代号名中Seed是豆包大模型团队名称,Edge代表最前沿的AGI探索。Seed Edge鼓励跨模态、跨团队合作,为项目成员提供宽松的研究环境,并实行更长周期的考核方式,以保障挑战真正颠覆性的AGI课题。Seed Edge初步确定了五大研究方向,包括探索推理能力的边界、探索感知能力的边界、探索软硬一体的下一代模型设计、探索下一代AI学习范式、探索下一个scaling方向。
北京时间1月22日,有消息称字节跳动今年在人工智能基础设施上投入超120亿美元,其中为2025年购买AI芯片准备了400亿人民币,是2024年支出的两倍。另计划在海外投资约68亿美元。对此,字节跳动相关人士向记者回应称:相关消息并不准确。字节跳动非常重视人工智能领域的发展与投入,但相关预算与规划传闻并不正确。
1月19日,字节跳动正式发布了一款面向专业的开发者提供服务的全新AI Coding产品Trae(trae.ai),实现了从Copilot向Autopilot的演进。该工具可选择简体中文或英文,并内置了GPT-4o、Claude-3.5-Sonnet模型供免费使用。
据维享时空PGVerse公众号消息,近日,上海维享时空信息科技有限公司与字节跳动旗下Pico正式签订战略合作协议,双方将在多个关键维度深度合作,全力推动XR技术在各行业的广泛应用,构建更为丰富多元的内容生态,为用户带来前所未有的沉浸式体验。
1月14日消息,山西政务服务平台显示,火山云太行算力中心二期项目建设用地规划许可证昨日获批。该项目位于广灵县,建设单位为字节跳动(抖音集团)旗下火山云(大同)科技有限公司,总投资450000.08万元。项目总占地面积307.5亩,共规划12kW服务器机柜15604台,规划网络机柜510架,结束时间为2026年5月。
1月14日消息,前字节大模型解决方案架构师潘雨楠加入创业公司珞博智能,担任联合创始人、CTO。据介绍,珞博智能成立于2024年1月,专注于大模型与具身智能硬件的创新应用,目前已完成千万元级人民币天使轮融资,预计2025年发布首款产品。
1月13日消息,近日,3D生成大模型公司影眸科技完成数千万美元A轮融资。本轮融资由美团龙珠、字节跳动领投,老股东红杉中国种子基金及奇绩创坛持续跟投,光源资本担任独家财务顾问。此次融资将用于支持影眸科技进一步推进3D大模型的前沿探索,保持公司在3D大模型领域的全球领先位置。同时推动以3D生成大模型Rodin为核心的Hyper3D系列产品在全球市场的商业化落地。