开发者朋友们大家好:
这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。
本期编辑:@JLT,@鲍勃
01有话题的新闻
1、英伟达 Mistral AI 联手发布 12B 参数小模型 Mistral Nemo,碾压 Llama 3 单张 4090 可跑
英伟达与 Mistral AI 合作发布了新的 AI 小模型 Mistral NeMo,具有 120 亿参数,支持 128K 上下文,在多项基准测试中击败了同类模型 Gemma 2 9B 和 Llama 3 8B。Mistral NeMo 旨在服务于企业用户,可以轻松定制和部署支持聊天机器人、多语言任务、编码和摘要的企业应用程序。
Mistral NeMo 模型性能优异,兼容性强,易于使用,并且可以直接替代任何使用 Mistral 7B 的系统。模型使用 FP8 数据格式进行推理,减少了内存大小并加快了部署速度,同时保持了准确性。Mistral NeMo 还支持多语言应用,具有高效的分词器 Tekken,提升了对多种语言的处理效率。此外,Mistral NeMo 已经准备好在云、数据中心或 RTX 工作站等任何地方运行,开发者可以使用 mistral-inference 试用 Mistral NeMo。
2、微软技术故障造成全球损失或超 10 亿美元
7 月 22 日,据美国研究机构安德森经济集团首席执行官帕特里克·安德森估计,此次微软技术故障事件造成的经济损失很可能超过 10 亿美元。不过报道称,Crowdstrike 公司是否会为相关损失买单尚不好说。
Crowdstrike 公司虽已道歉,但没有回应美国媒体就是否会给予受影响客户赔偿的问询。有分析人士指出,Crowdstrike 公司与客户签订的合同中或许有免责条款,可使其躲过赔偿。(@央视新闻)
3、传英伟达将推出中国特供版「Blackwell」架构 B20 加速器
7 月 22 日,据路透社援引知情人士的消息报道称,英伟达正在开发面向中国市场的基于全新 Blackwell GPU 架构的 AI 芯片版本,型号暂定为「B20」,该版本将符合美国之前的出口管制政策。
根据美国 2022 年 10 月推出的出口管制的政策,英伟达对华出口的 GPU 的 TPP(总处理能力)需要低于 4800 分。最初的 A100/H100 就是超出了这个限制,因此也导致了英伟达被迫推出了经过「阉割」的 A800/H800。
今年 3 月,英伟达发布了其新一代的基于「Blackwell」架构的 B200 系列芯片,其晶体管数量达到了 2080 亿个,是 H100/H200 的 800 亿个晶体管两倍多,其 20 petaflops 性能达到了 H100(4 petaflops)的 5 倍。据了解,B200 将于今年晚些时候量产。
同样,英伟达也计划针对中国市场推出基于 B200 的「阉割版本」——B20,但是鉴于美国出口管制政策的限制,英伟达 B20 性能相对于 B200 也将会大幅削减,相对于 H20 来说,其性能可能也不会带来多大的提升,不过其 HBM 的容量有望进一步提升,这对于 AI 训练和推理来说有着很大的助力。预计也将于今年晚些时候投入生产。(@搜狐科技)
4、Flow Studio:将单一文本转换成高质量的短片
Flow Studio 是由 Flow GPT 团队开发的能将文本转换成高质量的短片的工具。该平台由 Lifan Wang、Sam Xu、Qianhua Ge、Jay Dang 和 Luke Pioneero 共同开发,于 2024 年 7 月 18 日在 Product Hunt 上发布。Flow Studio 的亮点是能够通过单一的文本提示,自动生成一个包含故事、配音、背景音乐和声效的完整视频,极大地简化了视频制作过程。Flow GPT 获得了用户的高度评价,平均得分为 4.9/5 星。
创始人 Jay Dang 大学在加州大学伯克利分校学习计算机科学,他是 FlowGPT、Markit AI 和 LUUM 的创始人,也在 C。Light Technologies, Inc. 和 Glaucomark 担任过数据科学家和独立研究员。(@AI 科技评论)
5、GitHub Trending 热榜,构建多智能体和 RAG 的框架 Langflow
Langflow 是一个视觉化的框架,旨在帮助开发者构建多智能体和 RAG 应用程序。项目基于 Python 开发,已开源,可以完全自定义,同时支持不同的语言模型和向量存储。用户可以通过 pip 安装 Langflow,并且需要确保系统中安装的 Python 版本至少为 3.10。项目提供了详细的文档和部署指南。(@AI 科技评论)
6、马斯克:特斯拉有望 2026 年大规模生产人形机器人,供其他公司使用
7 月 22 日,马斯克在 X(推特)上发文透露,特斯拉明年将生产出「真正有用」的机器人供公司内部使用,但仅仅是小规模生产。2026 年,特斯拉有望大规模生产人形机器人,供其他公司使用。
今年 7 月 4 日的 2024 世界人工智能大会期间,特斯拉二代人形机器人 Optimus 亮相。近期,二代 Optimus 已经在特斯拉工厂尝试「打工」。借助视觉神经网络和 FSD 芯片,二代 Optimus 可以模仿人类操作,进行电池的分拣训练。
马斯克在上月召开的股东大会上宣布,把特斯拉的未来押注在 Optimus 机器人计划上,当前拟人机器人市场年产 10 亿台,特斯拉未来至少要占据 10% 的份额。马斯克当时表示,特斯拉以每台约 1 万美元的价格批量制造机器人,并以 2 万美元(当前约 14.6 万元人民币)的价格出售,从而获得 1 万亿美元的利润。此外,马斯克相信到 2026 年,Optimus 将成为一个完全软件定制的机器人。(@IT 之家)
02有态度的观点
1、大模型时代结束?大佬齐预测:AI 模型或需先缩小规模,才能再扩大规模
AI 领域出现新趋势,小模型因成本效益和易于部署受到关注。前 OpenAI 研究员 Andrej Karpathy 预测,未来 AI 模型将更小但更智能。大模型虽具数据吞吐和泛化能力,但面临高成本和资源消耗问题。小模型可从大模型中提炼优化,实现高效能。高质量数据集成为 AI 训练关键,小模型可能引领 AI 发展新方向。(@新智元)
写在最后:
我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。
对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。
素材来源官方媒体/网络新闻