英伟达和 Mistral AI 联手发布小模型 Mistral Nemo；英伟达或将推出中国特供版芯片丨 RTE 开发者日报

38 0 0

开发者朋友们大家好：

这里是 「RTE 开发者日报」 ，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE（Real-Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@JLT，@鲍勃

01有话题的新闻

1、英伟达 Mistral AI 联手发布 12B 参数小模型 Mistral Nemo，碾压 Llama 3 单张 4090 可跑

英伟达与 Mistral AI 合作发布了新的 AI 小模型 Mistral NeMo，具有 120 亿参数，支持 128K 上下文，在多项基准测试中击败了同类模型 Gemma 2 9B 和 Llama 3 8B。Mistral NeMo 旨在服务于企业用户，可以轻松定制和部署支持聊天机器人、多语言任务、编码和摘要的企业应用程序。

Mistral NeMo 模型性能优异，兼容性强，易于使用，并且可以直接替代任何使用 Mistral 7B 的系统。模型使用 FP8 数据格式进行推理，减少了内存大小并加快了部署速度，同时保持了准确性。Mistral NeMo 还支持多语言应用，具有高效的分词器 Tekken，提升了对多种语言的处理效率。此外，Mistral NeMo 已经准备好在云、数据中心或 RTX 工作站等任何地方运行，开发者可以使用 mistral-inference 试用 Mistral NeMo。

2、微软技术故障造成全球损失或超 10 亿美元

7 月 22 日，据美国研究机构安德森经济集团首席执行官帕特里克·安德森估计，此次微软技术故障事件造成的经济损失很可能超过 10 亿美元。不过报道称，Crowdstrike 公司是否会为相关损失买单尚不好说。

Crowdstrike 公司虽已道歉，但没有回应美国媒体就是否会给予受影响客户赔偿的问询。有分析人士指出，Crowdstrike 公司与客户签订的合同中或许有免责条款，可使其躲过赔偿。（@央视新闻）

3、传英伟达将推出中国特供版「Blackwell」架构 B20 加速器

7 月 22 日，据路透社援引知情人士的消息报道称，英伟达正在开发面向中国市场的基于全新 Blackwell GPU 架构的 AI 芯片版本，型号暂定为「B20」，该版本将符合美国之前的出口管制政策。

根据美国 2022 年 10 月推出的出口管制的政策，英伟达对华出口的 GPU 的 TPP（总处理能力）需要低于 4800 分。最初的 A100/H100 就是超出了这个限制，因此也导致了英伟达被迫推出了经过「阉割」的 A800/H800。

今年 3 月，英伟达发布了其新一代的基于「Blackwell」架构的 B200 系列芯片，其晶体管数量达到了 2080 亿个，是 H100/H200 的 800 亿个晶体管两倍多，其 20 petaflops 性能达到了 H100（4 petaflops）的 5 倍。据了解，B200 将于今年晚些时候量产。

同样，英伟达也计划针对中国市场推出基于 B200 的「阉割版本」——B20，但是鉴于美国出口管制政策的限制，英伟达 B20 性能相对于 B200 也将会大幅削减，相对于 H20 来说，其性能可能也不会带来多大的提升，不过其 HBM 的容量有望进一步提升，这对于 AI 训练和推理来说有着很大的助力。预计也将于今年晚些时候投入生产。（@搜狐科技）

4、Flow Studio：将单一文本转换成高质量的短片

Flow Studio 是由 Flow GPT 团队开发的能将文本转换成高质量的短片的工具。该平台由 Lifan Wang、Sam Xu、Qianhua Ge、Jay Dang 和 Luke Pioneero 共同开发，于 2024 年 7 月 18 日在 Product Hunt 上发布。Flow Studio 的亮点是能够通过单一的文本提示，自动生成一个包含故事、配音、背景音乐和声效的完整视频，极大地简化了视频制作过程。Flow GPT 获得了用户的高度评价，平均得分为 4.9/5 星。

创始人 Jay Dang 大学在加州大学伯克利分校学习计算机科学，他是 FlowGPT、Markit AI 和 LUUM 的创始人，也在 C。Light Technologies, Inc. 和 Glaucomark 担任过数据科学家和独立研究员。（@AI 科技评论）

5、GitHub Trending 热榜，构建多智能体和 RAG 的框架 Langflow

Langflow 是一个视觉化的框架，旨在帮助开发者构建多智能体和 RAG 应用程序。项目基于 Python 开发，已开源，可以完全自定义，同时支持不同的语言模型和向量存储。用户可以通过 pip 安装 Langflow，并且需要确保系统中安装的 Python 版本至少为 3.10。项目提供了详细的文档和部署指南。（@AI 科技评论）

6、马斯克：特斯拉有望 2026 年大规模生产人形机器人，供其他公司使用

7 月 22 日，马斯克在 X（推特）上发文透露，特斯拉明年将生产出「真正有用」的机器人供公司内部使用，但仅仅是小规模生产。2026 年，特斯拉有望大规模生产人形机器人，供其他公司使用。

今年 7 月 4 日的 2024 世界人工智能大会期间，特斯拉二代人形机器人 Optimus 亮相。近期，二代 Optimus 已经在特斯拉工厂尝试「打工」。借助视觉神经网络和 FSD 芯片，二代 Optimus 可以模仿人类操作，进行电池的分拣训练。

马斯克在上月召开的股东大会上宣布，把特斯拉的未来押注在 Optimus 机器人计划上，当前拟人机器人市场年产 10 亿台，特斯拉未来至少要占据 10% 的份额。马斯克当时表示，特斯拉以每台约 1 万美元的价格批量制造机器人，并以 2 万美元（当前约 14.6 万元人民币）的价格出售，从而获得 1 万亿美元的利润。此外，马斯克相信到 2026 年，Optimus 将成为一个完全软件定制的机器人。（@IT 之家）

02有态度的观点

1、大模型时代结束？大佬齐预测：AI 模型或需先缩小规模，才能再扩大规模

AI 领域出现新趋势，小模型因成本效益和易于部署受到关注。前 OpenAI 研究员 Andrej Karpathy 预测，未来 AI 模型将更小但更智能。大模型虽具数据吞吐和泛化能力，但面临高成本和资源消耗问题。小模型可从大模型中提炼优化，实现高效能。高质量数据集成为 AI 训练关键，小模型可能引领 AI 发展新方向。（@新智元）

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、项目、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

英伟达和 Mistral AI 联手发布小模型 Mistral Nemo；英伟达或将推出中国特供版芯片丨 RTE 开发者日报

素材来源官方媒体/网络新闻

# 随笔