Kimi 探索版发布,搜索量增强 10 倍;北大快手开源 Pyramid Flow Matching 丨 RTE 开发者日报

news/2024/10/12 15:07:57

 

 

 

开发者朋友们大家好:

 

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

 

本期编辑:@SSN,@鲍勃

01有话题的新闻

1、月之暗面发布 Kimi 探索版:搜索量相比普通版增强 10 倍,可精读 500 个页面

 

具备 AI 自主搜索能力的 Kimi 探索版于昨日(10 月 11 日)上线,其搜索量是普通版的 10 倍,一次搜索即可精读 500 个页面。

 

据官方介绍,该功能会模拟人类的推理思考过程并执行深度搜索,帮助用户更高效完成分析调研。通过自主策略规划、自动化大规模信息检索、对搜索结果的反思补充等多个步骤,用户可以获得更准确和全面的答案。

 

官方更称,测试表明 Kimi 探索版对比国内外主流 AI 助手和搜索类产品,综合性能超过同类产品至少 30%。

 

产品负责人介绍,「如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为 AI 更擅长调用的工具,人只需要专注于提出好的问题,AI 就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地找到所需答案。」目前该功能已逐步开放,下周一前推送至全量用户。(@IT 之家)

 

2、北大&快手开源 Pyramid Flow Matching,轻松生成 10 秒高质量视频的自回归方法

 

由快手科技、北京大学和北京邮电大学联合组建的研究团队推出 Pyramid Flow 文生视频模型,用户在输入文本之后,即可生成最长 10 秒、分辨率高达 1280x768、帧率 24fps 的高质量视频。

 

Pyramid Flow 文生视频模型主要面向开发者、艺术家和创作者等,提供更高效、更灵活的视频生成解决方案,目前已经在 Hugging Face 平台上线,并完全开源。(@IT 之家)

 

3、AMD 发布英伟达竞品 AI 芯片

 

北京时间 10 月 11 日凌晨,AMD 首席执行官苏姿丰在旧金山举行的 Advancing AI 2024 活动上,发布了 Instinct MI355X 加速卡、Ryzen AI Pro 300 系列处理器等一系列产品。

 

Instinct MI355X 加速卡:提供了业界领先的内存容量和带宽,256GB HBM3E 支持 6.0TB/s,比英伟达 H200 提供了高 1.8 倍的容量和 1.3 倍的带宽。与 H200 相比,AMD Instinct MI325X 的峰值理论 FP16 和 FP8 计算性能提高了 1.3 倍。

 

Ryzen AI Pro 300 系列处理器:CPU 采用 4nm 工艺打造,使用该公司最新的微架构,结合 GPU 与 Microsoft Copiliot+ 认证的神经处理单元 ( NPU) ,可实现 55 TOPS 性能的 AI 算力。AMD 表示,搭载 MI355X GPU 的平台将在明年下半年上市,与 MI325X 正面迎战英伟达的 BlackWell 架构产品。(@APPSO)

 

4、苹果研究人员质疑 AI 的推理能力:简单数学问题稍作改动就会答错

 

周四,苹果公司的一组研究人员发布了一篇名为《理解大型语言模型中数学推理的局限性的论文,揭示 LLM 在解决数学问题时容易受到干扰。研究人员通过对数学问题的微小改动,例如添加无关的信息,来测试 LLM 的推理能力。结果发现,这些模型在面对这样的变化时,其表现急剧下降。

 

例如,当研究人员给出一个简单的数学问题:「奥利弗星期五摘了 44 个奇异果,星期六摘了 58 个奇异果。星期日,他摘的奇异果是星期五的两倍。奥利弗一共摘了多少个奇异果?」时,LLM 能够正确地计算出答案。然而,当研究人员添加一个无关的细节,「星期日,他摘的奇异果是星期五的两倍,其中 5 个比平均小」时,LLM 的回答却出现了错误。例如,GPT-o1-mini 的回答是:「... 星期日,其中 5 个奇异果比平均小。我们需要从星期日的总数中减去它们:88(星期日的奇异果) - 5(较小的奇异果) = 83 个奇异果。」

 

上面只是一个简单的例子,研究人员修改了数百个问题,几乎所有问题都导致模型的回答成功率大幅下降。研究人员认为,这种现象表明 LLM 并没有真正理解数学问题,而是仅仅根据训练数据中的模式进行预测。但一旦需要真正的「推理」,例如是否计算小的奇异果,它们就会产生奇怪的、不合常理的结果。

 

这一发现对 AI 的发展具有重要的启示。虽然 LLM 在许多领域表现出色,但其推理能力仍然存在局限性。未来,研究人员需要进一步探索如何提高 LLM 的推理能力,使其能够更好地理解和解决复杂的问题。(@IT 之家)

 

5、传字节跳动在马来西亚裁员 700 多人

 

据路透社报道,有两位知情人士表示,字节跳动已经在马来西亚的子公司裁员 700 多名员工,因为字节跳动正在将重点转向使用 AI 进行内容审核上。

 

有消息人士表示,这些受到影响的员工大多从事的都是内容审核工作,并且已经在周三通过电子邮件收到了解雇通知。

 

而 TikTok 方面也在周五向路透社证实了裁员的消息,同时表示,作为其改善其审核运营的更广泛计划的一部分,预计全球将有数百名员工受到影响。(@爱范儿)

02态度的观点

1、黄仁勋:AI 未来在于「推理」,芯片成本大降是关键!

 

英伟达 CEO 黄仁勋最新表示,人工智能(AI)的未来将是能够「推理」的服务,但要达到这样的阶段需要先把计算成本降下来。黄仁勋表示,下一代工具将能够通过数百或数千个步骤并反思自己的结论来响应人类提出的问题。这将使未来的软件具有推理能力,与当前他每天都在用的、OpenAI 的聊天机器人 ChatGPT 完全不同。英伟达将通过每年把芯片性能提高到两至三倍,同时保持相同的成本和能耗水平,来为这些进步奠定基础。这将改变 AI 系统处理推论的方式——从数据中识别出规律或模式,并基于这些模式得出合理的结论。(@AI 科技评论)

 

写在最后:

 

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

 

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

 

 

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/70678.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

Jenkins定时构建

目录Jenkins 定时任务构建定时语法 Jenkins 定时任务构建选择需要定时执行的任务并进入点击 配置 按钮进入配置界面点击 构建触发器 并跳转到对应的配置部分,勾选上 Build periodically 选项在出现的日程表中填写对应的定时语句,并点击 保存 即可生效定时语法定时构建语法:*…

智能排线助力快消品企业实现高效与最优排线

路线拜访是快消品行业深度分销模式中高效开发、管理和维护终端市场的重要方式。通过将门店归入固定的路线内,确保每家店都能按合理的频率去拜访,确保既不丢店、不漏店,又能在合理周期内给门店补货,达到业代工作效率最大化。 所以对于企业而言,给业务人员的拜访路线做好最优…

Some bytes have been replaced with the Unicode substitution character while loading file

需要修改一较旧的网页代码,当打开时,却出现异常提示: Some bytes have been replaced with the Unicode substitution character while loading file 【文档路径】 with Unicode(UTF-8) encoding. Saving the file will not preserve the original file contents. 点“OK”…

SaaS架构:开放平台架构设计

大家好,我是汤师爷~ 今天聊聊开放平台架构设计。 为什么需要搭建开放平台 增强产品能力 开放平台能够让三方开发者和合作伙伴开发新的应用或服务,增加原有SaaS产品能力。这样就可以满足更多用户需求,从而提高用户的满意度和黏性。 促进创新 三方开发者能够在SaaS标准产品的基…

获取路由器(光猫)管理员权限

获取路由器(光猫)管理员权限 文章参考自 https://www.cnblogs.com/784040932/p/5922735.html 我家的光猫图片1.用光猫背后的useradmin 帐号和密码登录 http://192.168.1.1/2.然后在浏览器地址栏中输入http://192.168.1.1/backupsettings.conf以下载backupsettings.conf3.用文…

吴恩达机器学习课程 笔记6 神经网络的训练方法

神经网络的编译和训练编译compile():输入参数有“损失函数loss”、“优化器optimizer”、“评估指标metrics”。主要考虑前两项。 compile()函数所有的可选选项及其示例model.compile(loss=tf.keras.losses.BinaryCrossentropy(),optimizer=tf.keras.optimizers.Adam(learning…

企业网络服务搭建(一)OpenWRT uhttpd ddns firewall wireguard

简介: 最近要给媳妇的企业重新搞一搞信息化,这个也写个系列文章吧。 为什么要写openwrt呢?小公司,搞不起托管、搞不起上云。也不算搞不起,主要是自己手边各种垃圾材料多啊。自己家,公司,父母家,3处家用宽带。 本着垃圾佬的心态,能省则省。其实更多的是模拟大型异地办公…