AI创投周报|OpenAI推出AI编程智能体Codex,AI21 Labs完成由谷歌和
AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。
本图片由“千象”(网址:www.hidreamai.com)生成
1. OpenAI推出AI编程智能体Codex,优化软件工程任务效率
OpenAI近日由Greg Brockman领衔的六人团队发布了革命性AI编程智能体Codex,其基于强化学习训练的codex-1模型开发,专为软件工程任务优化设计,其核心突破在于将原本需数日的软件工程任务压缩至30分钟内完成,涵盖功能构建、代码库答疑、漏洞修复等全流程,SWE-bench基准测试中以72.1%高分超越Claude 3.7等竞品,目前该功能已面向ChatGPT Pro、Team和Enterprise用户开放,Plus和Edu用户也将很快获得访问权限。
Codex的核心优势在于其云端沙盒环境与智能化工作流程。每个任务都在独立隔离的环境中运行,并预加载用户代码库,支持文件读写及各类开发命令执行。通过实时进度追踪和完整的操作日志,用户可验证智能体的每一步操作。Codex还能根据代码库中的AGENTS.md文件自动适配开发规范,其生成的代码补丁清晰易审核,可直接融入标准工作流程。安全方面,OpenAI采用无网络访问的隔离容器,确保数据封闭性。虽然目前尚不支持图像输入等前端功能,但未来将推出更灵活的交互模式。随着免费试用期结束,OpenAI计划推出按需付费方案,推动编程协作进入智能化新阶段。
2. DeepSeek披露V3大模型降本技术:软硬协同突破训练资源限制
DeepSeek最新发表的论文深入探讨了其大模型V3/R1开发中硬件与架构协同设计的突破性实践。该研究由DeepSeek团队主导,联合学术界与工业界力量,基于2048块NVIDIA H800 GPU集群的训练经验,揭示了当前AI硬件在内存、计算和互连带宽方面的核心瓶颈。论文特别强调,这种软硬件协同设计为中小团队提供了低成本实现高效训练的可行路径,打破了传统大模型训练的资源垄断局面。
论文重点阐述了三大创新突破:首先,采用多头潜在注意力(MLA)架构将KV缓存内存占用压缩至每个token仅70KB,较同类模型降低80%以上;其次,通过DeepSeekMoE混合专家架构实现6710亿参数规模下单token仅激活370亿参数,计算成本较密集模型降低一个数量级;第三,首创FP8混合精度训练框架,配合多平面双层胖树网络设计,使通信带宽利用率提升50%。研究还前瞻性提出硬件改进方向,包括集成光互联、动态带宽调度等下一代网络架构,以及DRAM堆叠加速器等内存技术创新,为经济高效的大模型训练提供了系统级解决方案。
3. 字节跳动Seed团队开源8B参数代码模型Seed-Coder,提出 “模型中心” 数据管理范式
字节跳动旗下Seed团队首次开源了代码模型Seed-Coder,该模型以8B参数量超越同规模竞品,在多个基准测试中创下SOTA成绩。这项研究最突出的创新在于提出"模型中心"的数据管理范式,通过LLM自主生成和筛选高质量训练数据,显著提升了代码生成能力。团队同时开源了三个版本:基础版、指令优化版和推理增强版,其中指令版在编程任务中表现卓越,推理版更是在IOI 2024竞赛中超越了32B参数的QwQ模型。
Seed-Coder基于Llama 3架构,采用分组查询注意力机制,其核心突破在于数据处理流程。研究团队设计了四层数据过滤体系:从GitHub提取文件级和仓库级代码,收集7400万次高质量提交记录,以及从网络档案中挖掘代码相关文档。通过语法检查、MinHash去重和22万份代码训练的评分模型,最终筛选出1万亿token的高质量语料库。预训练创新性地分为两个阶段,并引入FIM和SPM等特殊训练目标。指令版本通过SFT和DPO两阶段优化,推理版本则采用LongCoT强化学习框架。该研究标志着大模型训练正朝着自动化数据管理方向发展,其宽松的MIT开源协议也体现了字节推动AI普惠的技术开放态度。
4. Prime Intellect发布INTELLECT-2模型,利用全球闲置算力分布式训练,性能媲美R1
Prime Intellect团队近日发布了全球首个分布式强化学习训练模型INTELLECT-2,其创新性在于整合全球闲置算力完成训练,性能媲美DeepSeek-R1。这家位于旧金山的初创公司由德国背景的Vincent Weisser和Johannes Hagemann联合创立,已获得包括Karpathy、HuggingFace联创Clem Delangue等AI界知名人士的投资,总融资额超2000万美元。团队仅用两个月就开发出核心框架PRIME-RL,并开源了包括参数分发网络SHARDCAST在内的四大关键技术组件。
INTELLECT-2通过去中心化架构实现了革命性突破:任何个人设备都能参与模型训练,采用异步机制使不同性能设备并行工作。其核心技术包含分片传输、多级缓存等创新方案,解决了大模型权重分发的世界性难题,实测带宽达590Mb/s。训练数据来自28.5万个可验证数学编码任务,采用双面GRPO剪辑等技术提升稳定性。虽然当前在IFEval基准上略逊于基线模型QwQ-32B,但在数学和编程任务上表现突出。这种分布式范式有望打破大公司对算力的垄断,开创全民参与AI训练的新时代。
5. MiniMax发布语音大模型Speech-02,登顶两大全球权威榜单超越OpenAI
国产AI公司MiniMax最新发布的语音大模型Speech-02在全球权威测评中实现突破,同时斩获Artificial Analysis Speech Arena和Hugging Face TTS Arena双料冠军,成为榜单前十中唯一的中国玩家。这一成绩标志着其成功超越长期占据榜首的OpenAI和ElevenLabs,后者分别是AI领域的全球领军者和专业语音合成巨头。MiniMax此前已通过"AI吴彦祖"英语陪练等应用引发关注,此次技术突破再次印证了其在多模态大模型领域的领先地位。
Speech-02的核心突破体现在超拟人化、个性定制和多语言支持三大维度。该模型仅需10秒语音样本即可精准复刻音色,支持32种语言的跨语种无缝切换,其独创的Flow-VAE技术能有效捕捉声音细节,在词错误率和说话者相似度等指标上全面超越竞品。实际应用中,无论是专业播音腔调、明星声线克隆,还是多语言混合播报,都能实现电影级效果。更值得注意的是,MiniMax以竞品一半甚至四分之一的价格提供SOTA级服务,已在教育、智能座舱、AI玩具等领域快速落地,与高途、极狐汽车等企业合作打造了多个爆款应用。这标志着中国在AI语音生成领域已具备重新定义行业天花板的技术实力。
6. DeepMind推出AlphaEvolve智能体,结合Gemini解决数学难题并优化工业应用
谷歌DeepMind近日推出由Gemini驱动的通用AI智能体AlphaEvolve,这一突破性成果由菲尔兹奖得主陶哲轩等专家参与验证。该智能体通过结合Gemini的创造性问题解决能力与自动评估器,采用进化框架优化算法设计,在数学和计算机科学领域取得多项里程碑式进展。其研发历时一年半,不仅改进了56年前的Strassen矩阵乘法算法,更在数据中心优化、TPU设计等实际应用中展现出强大跨界能力。
AlphaEvolve最突出的成就是在数学领域解决了包括300年历史的"接吻数难题"在内的50多个开放问题,其中75%重新发现了前沿解法,20%改进了已知最优解。它用48次标量乘法完成4x4复数矩阵乘法,颠覆了1969年以来的最优纪录;在11维空间中发现593个外球配置,刷新了几何学下限。实际应用方面,该智能体使谷歌数据中心计算资源利用率平均提升0.7%,下一代TPU电路设计删减冗余位,关键AI训练内核加速23%,并将优化周期从数周缩短至数天。这些突破标志着AI在算法创新和计算生态优化方面迈入新阶段,为科学研究和工业应用开辟了新路径。
7. Manus开放注册并推出图像生成功能,首次注册可获1000积分免费体验
Manus近日宣布全面开放注册并推出图像生成功能,结束了此前一码难求的局面。首次注册用户可获得1000积分免费体验,其创新之处在于将智能体工作流与图像生成相结合,不仅能理解用户意图,还能调用多工具完成任务。机器之心实测显示,该平台在品牌设计任务中表现出色,例如为青少年茶饮品牌CoLe生成的瓶身设计包含品牌标识、清新配色和水果图案,完整呈现了产品定位。
Manus的图像生成效果获得肯定,如时尚单品与场景的融合自然,露营、宠物等主题图片细节精致。但其网站部署功能耗时较长,完成简单网站需半小时左右,用户体验有待优化。尽管存在效率问题,该平台通过整合设计、开发流程,实现了从创意到落地的闭环服务,用户可获得包括源代码在内的完整产出物。目前网友对其底层模型来源仍存好奇,而运行速度成为普遍反馈的改进重点。
8. Lovart AI设计助手刷屏爆火,支持多场景设计且获专业人士认可
Lovart是由Liblib海外子公司推出的AI设计助手,其核心团队由资深算法工程师王浩帆(InstantID开发者)与Takumi领衔。这款工具在Beta测试上线24小时内便吸引超2万名申请者,其生成作品不仅被专业设计师@Ege用于高效完成整套品牌方案,还获得马斯克对特斯拉Robotaxi广告牌的公开点赞,展现出强大的市场吸引力。
Lovart通过多模型协同技术整合GPT、Gemini等顶尖AI,支持从海报、品牌VI到3D设计的一站式创作。其核心亮点在于“Talk-Tab-Tune”交互系统:用户可通过自然语言指令生成初稿,再通过点选画布分区精准调整,最终利用图层编辑功能实现图文分离等专业级修改。实测中,该工具不仅能保持盲盒角色设计风格统一,还能将普通街拍照升级为时尚大片,甚至自动拆解量子位LOGO生成全套VI方案。尽管生成视频耗时较长,但其流程化设计思维与PS级后期工具的结合,已为中小企业和营销团队提供了高效解决方案,标志着AI与设计师协作的新范式。
9. 苹果开源FastVLM,能在iPhone直接运行,首token输出速度提升85倍
苹果公司近期开源了高效视觉语言模型FastVLM,该模型能在iPhone等设备上直接运行,显著提升了移动端AI的图像理解能力。研究团队基于MLX框架开发了iOS/macOS演示应用,通过新型混合视觉编码器FastViTHD实现了85倍的首token输出速度提升。该技术突破主要解决了传统视觉语言模型在高分辨率处理时的延迟问题,为边缘计算场景提供了实用解决方案。
FastVLM的核心创新在于其独特的模型架构设计。研究团队开发的FastViTHD编码器融合了卷积层与Transformer模块,配合多尺度池化和下采样技术,将视觉token数量压缩至传统ViT的1/16。这种设计使得模型在1152×1152高分辨率下仍保持高效运行,同时支持0.5B至7B不同规模的参数版本。实验表明,该模型在文本密集型任务中表现优异,其帕累托最优曲线显示在固定延迟预算下性能比同类方案提升2.5个点以上,为移动端多模态AI应用开辟了新途径。
10. 昆仑万维开源Matrix-Game交互式世界生成引擎,支持指令生成虚拟世界
昆仑万维旗下团队推出突破性交互式世界生成引擎Matrix-Game,标志着"空间智能"技术迈入新阶段。这一由SkyworkAI开发的项目通过GitHub、Hugging Face等平台开源,其技术报告详细阐述了如何将科幻电影中的"矩阵"概念变为现实,让用户通过简单指令就能创造并操控细节丰富、物理规则完善的虚拟世界。
Matrix-Game的核心突破在于三大技术创新:首先构建了包含6000小时MineDojo数据的Matrix-Game-MC数据集,通过智能体探索和程序化模拟确保数据质量;其次开发了基于扩散模型的创新架构,实现从单张图像到可控交互世界的生成,支持自回归式视频生成和精准动作响应;最后建立了GameWorld Score评测体系,从视觉质量、时间一致性等四个维度进行量化评估。该引擎在沙漠、森林等多样场景中展现出90%以上的动作控制准确率,在双盲测试中获得96.3%的用户偏好率,显著超越现有技术标杆。其应用前景广阔,不仅能革新游戏开发流程,还可用于具身智能训练、影视制作和教育仿真等领域,为实现"物理图灵测试"提供了关键技术支撑。
人工智能初创公司的新融资
1. 人工智能初创公司AI21 Labs完成3亿美元的D轮融资
官网地址:http://www.ai21.com
AI21 Labs于近日完成3亿美元的D轮融资,由谷歌和英伟达等行业巨头领投,至此公司总融资额达6.36亿美元。本次融资旨在扩展其大语言模型产品和企业级AI解决方案。
公司最为人知的是其语言模型系列,其中Jamba系列专为长上下文理解和企业级应用打造,采用混合专家架构,结合状态空间模型与transformer技术,支持256000个token的上下文窗口,适用于复杂文本处理场景。此外,公司还推出写作助手Wordtune、开发平台AI21 Studio等工具。2025年3月推出的AI编排系统Maestro,可大幅提升主流模型指令遵循准确性,减少AI幻觉,提高推理准确率。
AI21 Labs于2017年由Mobileye创始人兼CEO Amnon Shashua、斯坦福大学荣誉教授及前谷歌首席科学家Yoav Shoham,以及连续创业者Ori Goshen创立。作为生成式AI的早期开拓者之一,AI21 Labs自成立以来,始终坚持“构建可信AI”的核心理念,致力于推动深度学习和自然语言处理(NLP)技术的深度融合,以实现更高水平的智能交互体验。
2. 网络安全创新公司OX Security完成6000万美元的B轮融资
官网地址:https://www.ox.security
网络安全创新公司OX Security于近日宣布完成6000万美元的B轮融资,以应对现代开发中的一个紧迫挑战:在应用安全中分辨信号与噪声。此次融资由DTCP主导,IBM Ventures、微软、Swisscom Ventures、Evolution Equity Partners和Team8等参与,使OX Security的总融资额达到9400万美元。
OX Security的首席执行官兼联合创始人NeatsunZiv表示:“随着AI生成代码成为新常态,其引入的风险往往隐藏在看似无害的代码下,而传统安全工具并不具备检测这些缺陷的能力。” OX Security的核心理念是精准优于数量,专注于真正可被利用、可接触和有影响力的5%问题,而非试图解决每一个理论上的脆弱性。这些缺陷可能被攻击者武器化,导致实际的数据泄露。OX的平台利用强大的应用安全态势管理(ASPM)引擎,将静态和动态分析、软件组成、CI/CD管道、云基础设施和运行时行为连接起来,超越一般警报,通过建模可利用性、分析攻击路径可达性以及将发现与业务影响相关联,提供有意义、可管理且可立即采取行动的风险概况。
3. 对话式AI平台开发商Parloa完成1.2亿美元的C轮融资
官网地址:https://parloa.com
对话式人工智能平台开发商Parloa于近日宣布成功完成1.2亿美元的C轮融资,使其估值达到10亿美元。本轮融资由Durable Capital Partners、Altimeter Capital和General Catalyst领投,EQT Ventures、RPT Capital、Senovo和Mosaic Ventures等参投。
Parloa是一家成立于2018年的人工智能公司,其核心产品AI Agent Management Platform允许企业通过低代码界面设计、部署和管理AI智能体,覆盖语音、聊天和消息等多个沟通渠道。平台支持企业根据需求定制创建具有预置或自定义技能的AI Agent,可处理路由、身份验证和常见问题等任务,并能与Salesforce、ServiceNow和Zendesk等现有系统实时集成。此外,Parloa平台还为人工坐席提供实时翻译和建议响应等功能,提升工作效率并确保跨语言和地区的客户服务质量。
4. 人工智能数据解决方案提供商Toloka完成7200万美元的融资
官网地址:https://toloka.ai
近日,Toloka宣布完成了7200万美元的融资,由杰夫·贝佐斯的个人投资公司Bezos Expeditions领投,Shopify首席技术官Mikhail Parakhin参与投资。
Toloka专注于在人类专家和测试人员网络的协助下训练和评估人工智能模型,拥有超20万名数据标注专家及专业人员网络,能够为AI公司提供40多种语言的定制数据集。其平台支持RLHF和DPO两种主流的AI模型对齐方法,还提供多种编程语言的代码样本,用于训练AI编程助手,全方位满足AI模型训练与优化需求。
Toloka背靠荷兰人工智能基础设施公司Nebius Group,凭借自身优势,该公司已与亚马逊、微软和Anthropic等行业巨头展开合作。强大的团队背景与丰富的合作经验,为Toloka在AI数据服务领域持续深耕奠定坚实基础。
5. 销售自动化初创公司Clay宣布完成一轮要约收购
官网地址:https://www.clay.com
近日,销售自动化初创公司Clay宣布完成一轮要约收购,Sequoia Capital领投。Sequoia同意购买高达2000万美元的员工股票,这一要约收购使Clay的估值从今年一月份B轮融资时的12.5亿美元上升至15亿美元。
Clay作为全球知名Agent平台,其主打智能体产品Claygent实力非凡,累计自动化运行超10亿次,可自动化处理繁琐业务流程、整合分析互联网信息,广泛应用于人力资源、金融、销售等多领域。例如,OpenAI借助Clay将数据增强覆盖率从40%提升至80%。此外,Clay平台支持与130多家世界级数据合作伙伴集成,提供数据增强服务;Claygent还具备数据研究、挖掘、清洗格式化及多平台集成能力,同时遵循SOC 2 Type II合规等严格标准,保障数据安全与隐私,全方位满足企业销售自动化需求。
Clay成立于2015年,由Kareem Amin和Varun Anand共同创立。凭借创新技术与优质产品,Clay在市场中成绩斐然,2022-2023年收入连续实现10倍增长,2024年增长6倍,2025年第一季度依旧保持显著增长态势。目前,其客户超8000家,涵盖OpenAI、HubSpot、Canva等知名企业,在全球运营50多个Clay俱乐部。
6. AI模型提供商Fastino完成1750万美元的种子轮融资
官网地址:https://www.fastino.ai
近日,Fastino宣布完成了一轮1750万美元的种子轮融资,由知名投资机构Khosla Ventures领投,Insight Partners、Valor Equity Partners以及知名天使投资人前Docker首席执行官Scott Johnston和Weights & Biases首席执行官Lukas Biewald参与。此轮融资将用于进一步研发和推广其产品,以满足不断增长的企业AI需求。
Fastino于2024年1月1日,由Ash Lewis和George Hurn-Maloney共同创立,两人都是连续创业者,尤其Ash Lewis此前还参与创立过DevGPT、Ashtv AI等AI原生公司。Fastino主要为企业AI开发人员提供可扩展的任务优化语言模型。其模型专为准确性、速度和安全性而设计,可提供近乎即时的CPU推理和跨环境的灵活部署。Fastino的核心理念是开发一种新型的AI模型架构,专为小型化和特定任务设计。与那些需要数百万美元投资的传统模型不同,Fastino的模型可以使用总值不足10万美元的低端游戏显卡进行训练,这一创新方法正吸引了广泛关注。
7. 游戏营销AI Agent开发商Sett完成1500万美元的A轮融资
官网地址:https://www.sett.ai
Sett在近日宣布完成了1500万美元的A轮融资,此轮融资由Bessemer Venture Partners领投,其他投资者包括Saga Ventures、F2 Venture Capital、Vgames以及游戏行业领袖Akin Babayigit。这笔资金将用于加速Sett的产品开发和市场推广,进一步扩大其在商业智能领域的创新能力。Sett已经与包括Playtika、SuperPlay、Candivore和Cyplay在内的顶级游戏公司合作。
Sett是一家专注于开发AI技术以帮助移动游戏设计和运营的初创公司。Sett的核心目标是解决移动游戏行业的一大痛点:如何在竞争激烈的市场中吸引用户注意。该公司提供的解决方案是一款基于AI的Agent,能够以15倍的速度和25倍的成本效率生成“可玩”广告和其他营销内容。Sett的Agentic AI平台能够自动创建基于真实活动数据的高性能营销和游戏内内容,帮助移动游戏工作室更快地移动,减少制作时间,并在价值1000亿美元的游戏市场中保持竞争力。
8. AI Agent初创公司Relevance AI完成2400万美元的B轮融资
官网地址:https://relevanceai.com
Relevance AI于近日宣布完成2400万美元的B轮融资,由Bessemer Venture Partners领投,King River Capital、Insight Partners和Peak XV等长期合作伙伴参投。Relevance AI旨在创建一个仅受想法限制而非员工数量限制的世界,其平台在2025年1月就已创建了40000个AI代理,本融资资金将用于进一步加速Relevance AI增长。
Relevance AI由Jacky Koh、Daniel Palmer和Daniel Vassilev创立,其团队构建了一个代理操作系统,使主题专家而不仅仅是工程师能够创建和部署能够执行特定组织的人类质量工作的专业化AI代理。从快速成长的初创公司到像Qualified、Activision和Safety Culture这样的财富500强公司,各种组织发现AI劳动力不仅关乎效率,更是对工作完成方式的重新构想。Relevance AI计划利用这笔资金进一步增强其AI代理的产品能力,并为其主要市场的澳大利亚和美国客户提供支持。
关于阿尔法公社