2024-11-22 AI日报 - AI应用与实战网

Wordware获3000万美元融资，AI开发将像写文档一样简单

Wordware，一家旧金山的初创公司，宣布完成3000万美元的种子轮融资，由Spark Capital领投，成为Y Combinator历史上最大的首次投资之一。该公司开发了一个自然语言平台，旨在简化AI开发，使非程序员也能创建AI智能体。目前，Wordware已吸引数十万用户，并为企业客户提供服务。公司计划于2025年初进一步扩展至个人用户市场，推动AI自动化。

Lightning AI获5000万美元融资，PyTorch Lightning下载量突破1.6亿

Lightning AI，一家由William Falcon领导的纽约人工智能公司，宣布完成了5000万美元的新一轮融资，使累计融资总额达到1.03亿美元。该公司以开发PyTorch Lightning深度学习框架著称，全球下载量超1.6亿次。此轮融资将用于扩大业务和加强产品研发。Lightning AI的AI开发平台能显著简化AI模型的训练、部署和扩展过程，目前已有24万用户来自2000多个组织。轮融资的成功反映了市场对其技术和企业级AI开发工具需求的认可。

英伟达 CEO 称自己也痴迷于谷歌NotebookLM AI 工具

英伟达在上一季度售出了价值310亿美元的AI系统，展示了其在人工智能领域的领导地位。CEO黄仁勋表示，公司最新GPU产品“Blackwell”的生产进展顺利，预计将在财年第四季度创造数十亿美元收入。此外，黄仁勋强调推理任务将成为数据中心GPU芯片销售的新增长点，并频繁使用谷歌的Notebook LM工具来处理文档。

Meta最新音频大模型SPIRIT LM，让AI不止能说会道，还能“声情并茂”！

Meta AI开源了SPIRIT LM，一个基于70亿参数的多模态语言模型，能够处理文本和语音的混合任务。该模型分为基础版（BASE）和表达版（EXPRESSIVE），后者在情感表达上更为出色。SPIRIT LM通过“交错训练”方法从大量文本和语音数据中学习，目前支持英语并计划扩展至其他语言。它是首个能跨模态保留情感信息的AI模型，未来有望实现更自然的情感表达交流。

AI助力800年古迹浴火重生！时隔5年，巴黎圣母院终于完成修复

巴黎圣母院历经5年、耗资约7亿欧元的修复工程，在现代科技如数字孪生技术、3D建模等辅助下，于11月8日初步完成，标志性尖顶和内部结构得以重建。修复团队利用激光扫描技术和详尽的数字模型，精准恢复了包括186个拱顶在内的建筑细节。该工程展示了传统工艺与现代科技的结合，预计12月7-8日正式对外开放，为全球古建筑修复提供宝贵经验。

新一代视觉追踪模型SAMURAI：复杂的场景里也能追踪到主体

华盛顿大学的研究团队开发了新型视觉追踪模型 SAMURAI，通过对 SAM2 模型的改进，引入时间运动线索和运动感知记忆选择机制，显著提升了在复杂场景中追踪快速移动和自遮挡物体的能力。评估显示，SAMURAI 在 LaSOT-ext 和 GOT-10k 数据集上分别实现了7.1% 和3.5% 的性能增长，展示了出色的零-shot 性能和广泛的应用潜力。

谷歌新Gemini试验版夺回AI竞技榜首，GPT-4o仅称王一天

谷歌推出的最新模型Gemini-Exp-1121在发布后迅速超越OpenAI的GPT-4o，重新登上AI竞技榜榜首。该模型在代码能力、推理能力和视觉理解方面均有显著提升，并在实际测试中表现出色。与此同时，OpenAI正在研发“实时摄像”功能，预示着未来与AI交流方式的转变。

三星推出全新 Gauss 2 AI 模型或将成为下一个Galaxy大脑

三星在开发者大会上发布了全新的Gauss2AI模型，性能和效率全面提升，支持多模态处理并覆盖多种智能设备。Gauss2有Compact、Balanced和Supreme三种版本，分别适用于离线设备、平衡性能与效率及最佳性能场景。相比前代，Gauss2运行速度提升1.5到3倍，支持14种语言。目前，超过60%的三星DX部门开发者已使用该模型提升工作效率。未来，Gauss2有望在实时翻译、推荐系统及图像编辑等方面发挥重要作用。

消息称OpenAI的AI数据供应商Crusoe获 6.86 亿美元融资

Crusoe Energy，一家成立于2018年的初创公司，正进行一轮818百万美元的融资，目前已有686百万美元到账。该公司从加密货币业务转型，专注于为Oracle、Microsoft和OpenAI等企业提供AI基础设施和数据中心服务，并计划与Blue Owl Capital合作，在德克萨斯州建设大型数据中心。随着AI和云计算需求的增长，数据中心建设对环境的影响也日益显著，引发对可持续发展的关注。

相当讽刺！美国明州反深度伪造法案疑似用AI编写的

明尼苏达州关于“使用深度伪造技术影响选举”的法律在联邦诉讼中出现争议，原告律师团指出支持该法律的宣誓书可能包含由人工智能生成的文本，引用的研究也缺乏实证依据。这引发了对人工智能在法律文件中应用的讨论，强调了确保信息准确性的必要性。

Blue Bear Capital 获1.6 亿美元融资，支持AI在气候、能源和工业领域应用

Blue Bear Capital采取以软件为中心的投资策略，认为软件在气候科技领域的重要性不亚于硬件。通过软件支持，如监控服务，可以显著提高太阳能发电场的性能。例如，10%的性能提升在100吉瓦的装机容量中相当于增加10吉瓦发电量，约等于3-5座煤电厂或核电站的产能。公司已完成1.6亿美元第三期基金募集，计划投资约15家公司，每笔首次投资约500万美元，并预留1000万美元用于后续跟投。这种投资策略反映了气候科技领域的新兴趋势，并展示了数字化解决方案在应对气候变化中的潜力。

亚马逊投资1.1亿美元用于 Trainium 芯片的 AI 研究

亚马逊宣布投入1.1亿美元支持“Build on Trainium”计划，旨在通过40,000个Trainium芯片促进大学AI研究，降低对Nvidia的依赖，推动AWS技术进步。所有研究成果将开源，并为获选项目提供AWS培训积分和资源。

重磅升级！Brave搜索推出AI对话功能，打造搜索引擎新体验

Brave搜索引擎新增“Answer with AI”对话模式，允许用户连续追问，提升搜索体验。该功能结合了传统搜索引擎和AI聊天机器人的优势，使其在与Google的竞争中脱颖而出。数据显示，Brave搜索每天处理超3600万次查询，“Answer with AI”功能每日生成超1100万个答案。Brave还强调用户隐私保护，不存储查询记录。

西班牙BBVA银行成功部署ChatGPT企业版五个月创建2900个GPTs

BBVA银行在全球范围内成功部署ChatGPT企业版，五个月内创建了超过2900个定制化应用程序，显著提升了员工的工作效率和创新能力。通过民主化的AI推广策略，3000名员工获得许可证，开发的应用包括加速数据分析和内容创作，以及提高法律咨询和客户反馈处理的效率。未来，BBVA计划扩展ChatGPT应用，提供更个性化服务。

AI2开源训练方案Tülu 3，打破大模型后训练技术垄断

AI2发布的Tülu3后训练方案使“原始”大语言模型能够转化为实用AI系统，涵盖从主题选择到数据治理等全方位流程。测试显示，该方案训练的模型性能已达顶级开源模型水平。此举为机构提供了自主可控的选择，尤其适用于处理敏感数据的行业，同时推动了AI民主化和开源生态的发展。

H2O.ai推多智能体平台h2oGPTe，提升AI智能体响应一致性与准确性

H2O.ai 推出了新平台 h2oGPTe，结合生成性和预测性 AI 模型，提供一致响应。该平台适用于金融、电信、医疗和政府等行业，支持多模态数据处理和自主任务执行。H2O.ai 强调数据溯源和智能体测试，以确保可靠性与准确性。

卷疯了！谷歌云也推出了新智能体平台：AI Agent Space

谷歌云推出了新的AI智能体生态系统项目——AI Agent Space，旨在帮助企业实现任务自动化、提升客户体验和优化运营效率。该项目提供丰富的工具和资源，包括早期预览和技术支持，以开发高度可定制的AI代理。目前已知的应用案例包括克森美孚、德勤和普华永道等企业的具体应用。然而，目前AI Agent Space中仅有19种代理模型，数量上落后于微软、SAP和Salesforce等竞争对手。谷歌希望通过合作伙伴驱动的开放生态系统来推动创新。

Anthropic CEO抨击著名风险投资人观点称人工智能只是数学

Anthropic CEO Dario Amodei在AI大会上表示，尽管当前AI模型对人类不构成即刻威胁，但他批评了一些人低估AI风险的态度，并反驳了Marc Andreessen将AI等同于数学的观点。Amodei强调，随着AI技术快速发展，特别是自主执行任务的AI“代理”出现，需要建立更好的控制机制。与此相反，Andreessen主张AI应自由发展，并反对对其监管。这场辩论凸显了在AI创新与监管之间找到平衡的重要性。

ChatGPT-4o 重磅升级：创意写作能力媲美 Eminem 更贴合需求

OpenAI为ChatGPT Plus订阅用户推出升级版ChatGPT-4o，其在创意写作方面表现出色，尤其在说唱歌词和故事创作上更为自然和引人入胜。此外，ChatGPT-4o还能处理并分析文件如电子表格和图像，提升了数据处理能力。此次升级仅限Plus用户，免费用户仍使用旧版模型。

李彦宏：百度计划在明年初推出新版本文心Ernie模型

百度2024年第三季度营收336亿元人民币，同比下降3%；净利润76亿元人民币，非美国通用会计准则下为59亿元人民币。财报电话会议上，董事长李彦宏强调了百度在基础模型能力上的持续提升，尤其是文心系列模型的发展，包括即将推出的新版文心（Ernie）。百度注重模型的实际应用和性能优化，已将其视觉基础模型应用于自动驾驶领域，并探索多模态能力，以维持市场领导地位。

到2025年，数据质量将成为AI成功的关键比生成式技术重要

到2025年，企业在采用AI时将更注重数据质量和治理，而非仅依赖生成性AI技术。高质量、实时的专有商业数据将成为推动AI效率和竞争力的关键。开放和无关平台将促进AI创新及数据的无缝集成。

医生不敌 AI：ChatGPT 诊断准确率高达 90%！

研究表明，OpenAI的ChatGPT-4在医疗诊断准确率上达到90%，显著高于医生使用该工具时的76%和未使用工具的74%。研究发现医生常忽视AI建议，主要由于过度自信和缺乏了解，强调了AI与医疗专业人员合作的重要性。然而，缺乏培训和信任成为AI融入医疗实践的主要障碍。

OpenAI 拟推出自研浏览器挑战谷歌霸主地位

OpenAI计划推出基于AI聊天机器人的自研浏览器，挑战谷歌搜索市场，并与多个平台合作提供AI驱动的搜索服务。目前，OpenAI已在ChatGPT中新增搜索功能，使用微调后的GPT-4模型，并与多家新闻出版商合作收集反馈。未来，该功能将逐步覆盖更多用户，并与微软Bing等竞争对手展开竞争。

苹果正在研发更具对话性的 Siri 语音助手计划2026年发布

苹果公司正研发一款基于大型语言模型的新版Siri语音助手，计划于2026年春季发布。新Siri将提供更自然的对话体验，并在发布前集成OpenAI的ChatGPT等第三方AI功能。

写作能力更强！OpenAI对GPT-4o重大升级，重夺最佳AI模型桂冠

OpenAI宣布对GPT-4o进行了重大升级，使其在推理、跨媒体和对话能力等方面表现更佳。在“Chatbot Arena”评估平台的测试中，GPT-4o超越Gemini-Exp-1114，位居第一。升级后，GPT-4o在创意写作、编程及处理复杂问题方面也名列前茅。免费用户仍可享受有限权限，而ChatGPT Plus订阅用户（每月20美元）可获得无限制访问及其他高级功能。此次升级巩固了GPT-4o作为先进AI模型的地位。

全新突破！YouTube Shorts上线AI视频背景生成功能

YouTube在Shorts功能中引入了由Google DeepMind的Veo模型支持的“Dream Screen”，允许创作者生成1080p高清AI视频背景，且即将推出6秒独立视频片段生成功能。目前该功能已在美、加、澳、新四国上线，使YouTube在短视频领域的技术优势更加明显，而竞争对手TikTok尚无类似功能。