• 首页
  • 快播
  • 大香蕉
  • 有毒吗
  • 很狠撸
  • 网站
  • 小说
  • 快播

    你的位置:黑丝足交 > 快播 > 第四色播室 开源日报|DeepSeek

    第四色播室 开源日报|DeepSeek

    发布日期:2024-12-28 00:38    点击次数:175

    第四色播室 开源日报|DeepSeek

    宽宥阅读 OSCHINA 裁剪部出品的开源日报——您探索和相识开源天下的日常指南。在这里第四色播室,咱们每天从宏不雅到微不雅,全面展现开源技巧和文化的动态图景。

    逐日一更,风雨无阻。

    OpenSource Daily # 2024.12.27省流概览

    - DeepSeek-V3 首个版块上线并开源

    - ChatGPT 本月第二次大限度宕机,OpenAI 称问题来自“上游供应商”

    - 字节本年 AI 研发参加接近 BAT 三家总额

    - 微软被曝与 OpenAI 发生争执,因配合、分红等问题导致

    - Ruby 3.4 发布

    - 在 DeepSeek 论文里看到了早期 Google 和 OpenAI 的影子

    - Andrej Karpathy:DeepSeek 今天发达得行云活水

    - 8 台新款 Mac Mini 就不错跑 671B 的 DeepSeek-V3

    伸开剩余94%

    - 脑机接口和 AI,一个硬币的两面

    - 豆包订价一元的贪心:字节杰出打响 AI 解围战

    本日要闻

    DeepSeek-V3 为自研 MoE 模子,671B 参数,激活 37B,在 14.8T token 上进行了预老师。

    论文会聚:https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

    DeepSeek-V3 多项评测获利超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模子,并在性能上和天下顶尖的闭源模子 GPT-4o 以及 Claude-3.5-Sonnet 不分昆玉。

    ChatGPT 本月第二次大限度宕机,OpenAI 称问题来自 “上游供应商”

    好意思东时期 12 月 26 日周四,OpenAI 阐述,好意思东时期上昼 11 点整,旗下工作开动发生大限度宕机。系统工作中断于北京时期 12 月 27 日凌晨 2 点 30 分支配开动,影响 ChatGPT 聊天机器东说念主、Sora 视频生成模子以及部分 API 调用。

    OpenAI 公布的气象页面闪现,OpenAI 在 11 点整公布启动造访,称 ChatGPT、Sora 和和 API 齐出现高荒唐率,11 点 18 分阐述,问题出自 “上游供应商”,在监控情况。

    尔后,OpenAI 分辩在 12 点 06 分和 13 点 05 分更新气象称,不绝辩论处理问题,14 点 05 分称,Chat GPT 也曾部分还原平常,聊天记载仍未加载,OpenAI 在不绝处理问题。

    巧的是,在 OpenAI 发生宕机的同期,OpenAI 的独家云工作器供应商微软陈诉称,旗下一个数据中心出现 “电源问题”,主要影响到北好意思地区用户,正在造访这个问题。

    字节本年 AI 研发参加接近 BAT 三家总额

    浙商证券在其陈诉中指出,字节杰出在 AI 上加大流量投放、扩大成本开支、幽闲彭胀团队,研发参加显赫早先同业。在资金上,字节杰出在 AI 上参加雄壮,2024 年景本开支达到 800 亿元,接近百度、阿里、腾讯三家的总额(约 1000 亿元)。

    2025 年,字节杰出成本开支有望达到 1600 亿元,其中约 900 亿元将用于 AI 算力的采购,700 亿元用于 IDC 基建以及聚积树立。

    微软被曝与 OpenAI 发生争执,因配合、分红等问题导致

    据 The Information 报说念,微软和 OpenAI 正就配合条目进行争执,其摩擦焦点主要触及两边的云计较交游、收入分红和 IP 问题。据称,微软和 OpenAI 满足约 10 月份以来一直在洽谈 OpenAI 结构的潜在颐养,会谈要点接洽了微软是否会不绝得到 OpenAI 20% 的收入。

    此前有音问称,微软正在讲和更多大模子供应商,以裁减旗下软件关于 OpenAI 的依赖。

    Ruby 3.4 发布

    Ruby 谈话以在圣诞节这天发布要紧更新闻明,本年的圣诞节固然也不例外,它释出了 Ruby 3.4。主要新特质包括:引入 it 用于援用一个莫得变量称呼的区块参数;默许明白器 Prism;socket 库接济 RFC 8305 “Happy Eyeballs V2”;纠正 YJIT just-in-time 代码性能,等等。

    确定:https://www.ruby-lang.org/en/news/2024/12/25/ruby-3-4-0-released/

    本日不雅察 酬酢不雅察

    英文技巧社区对中国 AI 产业的进步速率处于一种半滚动半懵逼的气象

    这几天刷推很显然的嗅觉到英文技巧社区对中国 AI 产业的进步速率处于一种半滚动半懵逼的气象,应激开首主如果两个,一个是宇树(Unitree)的轮足式机器狗 B2-W,另一个是开源 MoE 模子 DeepSeek-V3。

    如果说宇树是在硬件上引起了一波怀疑实践的热度,那么 DeepSeek 则在软件的原生土地,把大模子厂商齐给硬控住了。

    我最早对梁文锋有印象,是「西蒙斯传」里有他写的序,西蒙斯是文艺回复科技公司的独创东说念主,用算法模子去作念自动化投资的始创者,梁文锋其时管着 600 亿东说念主民币的量化私募,写序属于义正辞严的给行业祖师爷致意。

    交待这个配景,是念念说,梁文锋的几家公司,从量化交游作念到大模子开辟,并不是一个金融转为科技的历程,而是数学手段在两个哄骗场景之间的切换,投资的倡导是量度市集,大模子的旨趣亦然量度 Token。

    - 微博 阑夕

    在 DeepSeek 论文里看到了早期 Google 和 OpenAI 的影子

    香港艳星

    一则小故事,数学家伯努利看到一篇匿名数学论文,立时认出是牛顿的手笔:从爪子判断这是一头雄狮。

    阅读完 DeepSeek V3 技巧陈诉有一种访佛的嗅觉,在 DeepSeek 论文里看到了早期 Google 和 OpenAI 的影子:追务实效、狂野的念念象力、塌实的工程托福才能(念念象力齐能考据和终了)三方面的调和。从 MLA,MoE 踏实老师技巧到推理部署,乃至终末对硬件迭代标的的忽视,让国际同业也 respect ,属实犀利。

    - 微博 安分木

    Andrej Karpathy:DeepSeek 今天发达得行云活水

    Andrej Karpathy:DeepSeek(中国东说念主工智能公司)今天发达得行云活水,发布了一款前沿级 LLM 的敞开权重模子,况且该模子的老师预算极其弥留(2048 个 GPU 运行 2 个月,耗资 600 万好意思元)。

    算作参考,这种级别的才能不绝需要近 16,000 个 GPU 的集群,而咫尺正在参加使用的 GPU 数目则接近 10 万个。举例,Llama 3 405B 使用了 3080 万 GPU 小时,而 DeepSeek-V3 看起来是一个更强的模子,仅使用了 280 万 GPU 小时(计较量减少了约 11 倍)。如果该模子还能通过氛围查抄(举例 LLM 竞技场排行正在进行中,我的一些快速测试到咫尺为止进展成功),这将在资源律例下展现出相适时东说念主印象潜入的辩论和工程后果。

    这是否意味着你不需要大型 GPU 集群来野蛮前沿 LLMs?不,但你必须确保不忽地现存资源,这看起来是一个很好的示范,标明在数据和算法方面仍有好多使命要作念。

    - 微博 i陆三金

    - 微博 蚁工场

    贾扬清认可 DeepSeek 的技巧才能

    贾扬清转了这个帖子认可 DeepSeek 的技巧才能,说他在 2019 年就和 DeepSeek 作念过技巧一样,其时提了技巧忽视是 “你们不需要复杂的云捏造化,只需要容器和一个高效的调节器。你们需要确凿快速、互联的专科聚积,比如 RoCE 或 Infiniband。你们需要一个通用的存储有诡计,比如 NFS,不需要太花哨,但必须阔气快。让 AI 开辟者惬意,而不是让 SRE(站点可靠性工程师)惬意。” 而 DeepSeek 的东说念主示意他们也曾在这样作念有一段时期了。

    - 微博 蚁工场

    媒体不雅察这一年,中国机器东说念主大步走向天下

    在 2024 年的全球科技邦畿上,中国机器东说念主产业扬帆开拔,加快 “出海”。从餐饮配送到工业制造,从医疗辅助到智能家居,从破钞工作到物流仓储,中国机器东说念主的身影无处不在,正以优胜的性能和立异的技巧,为全球智能制造和产业升级孝顺中国有诡计和中国灵敏。

    - 东说念主民日报国际版

    各界拥抱 AI 限度化产业哄骗机会

    视频生成、语音交互等 AI 哄骗连年来抓续火热,在 2024 年已让越来越多用户得到高效方便的体验。更令业界预防的是,2024 年各传统行业开动拥抱 AI 技巧,将行业数据、计较模子赋予具备深度学习才能的 AI,在工业分娩规模开启限度化哄骗的旅途。

    - 经济参考报

    脑机接口和 AI,一个硬币的两面

    脑机接口一度承载了东说念主们对赛博格的绝大部分念念象,然而这两年脑机接口的进步似乎并不是料念念中的快,尤其是在 AI 日眉月异的进步映衬下。

    这其中固然有好多复杂的原因。脑机接口自己等于一个典型的交叉学科,触及到了电极材料、芯片封装、医疗器械、算法,是一个特殊复杂的全系统。更为要道的是,伦理问题使得脑机接口的每一次考研齐必须十分在意。彭雷提到,他们常常需要一年时期来准备一场考研。

    - 极客公园

    从「天才少年」到被动「追逐者」:诺奖得主、AlphaGo 之父 Demis Hassabis 眼中的 AI 改日

    当今,算作 Google DeepMind 首席 AGI 科学家,Legg 将 AGI 界说为 “至少不错在东说念主们不绝不错完成的贯通任务中与东说念主类才能相匹配的东西”。Hassabis 关于某个实体(不一定是谷歌)何时能实现 AGI 留了很大的余步,一边说,“10 年后有 50% 的机会”,又一边说,“如果它发生得更早,我也不会感到骇怪。”

    - 学术头条

    大模子 2024:从“烧钱”到“获利”的急转弯

    这一年,AI 成为大国角力的新战场。中好意思两国,异曲同工齐幽闲鼓动东说念主工智能的发展。在国内,“东说念主工智能 +” 引颈了全年的大模子落地潮,央国企成为先行力量。而大洋此岸,“硅谷七姐妹” 领涨好意思股,AI 卖铲东说念主英伟达从年头笑到年尾。

    - 数智前列

    豆包订价一元的贪心:字节杰出打响 AI 解围战

    从互联网萌芽到出动时间,从 BAT 鼎峙到新兴力量崛起,中国科技产业的发展历程告诉咱们:唯有与时俱进,方能立于无坚不摧。关于字节杰出而言,豆包的市集发达粗略仅仅一个开动,如安在全球 AI 竞技场上为中国科技企业赢得更多话语权,才是其濒临确实凿进修。

    - 投资者网

    本日保举

    开源模式

    thanos-io/thanos

    https://github.com/thanos-io/thanos

    Thanos 是一组不错构成具有永远存储期限的高可用诡计系统的组件,不错将其无缝添加到现存 Prometheus 部署之上。

    开源之声用户不雅点

    不雅点 1:其实最炸场的是它的老师成本,惟有同级别的十分之一以致更低,几乎是工程遗迹

    不雅点 2:国内的大模子一发表等于啥齐最过劲,确凿一用啥也不是

    不雅点 3:deepseek 和 qwen 如实是犀利的,宣传上很谦卑了。其他的差未几就像你说的那样

    不雅点 4:念念知说念大众在 jb 家软件或者 vscode 上,用什么 AI 插件自界说 api 接口的?

    不雅点 5:不错看 awesome-deepseek

    不雅点 6:中国在基础辩论相识滞后,但在哄骗开辟方面如实算遥遥早先

    不雅点 7:600b 对比 300b?过劲

    不雅点 8:绝不夸张地说,Deepseek 是国产开源之光。

    不雅点 9:我前天试用了一下 chat,嗅觉除了推理之外很一般,今天再望望

    不雅点 10:然而 deepseek 提供的 api 速率太慢了,模子提高了 api 速率提高了吗

    不雅点 11:3 倍速率

    不雅点 1:其实最炸场的是它的老师成本,惟有同级别的十分之一以致更低,几乎是工程遗迹

    不雅点 2:国内的大模子一发表等于啥齐最过劲,确凿一用啥也不是

    不雅点 3:deepseek 和 qwen 如实是犀利的,宣传上很谦卑了。其他的差未几就像你说的那样

    不雅点 4:念念知说念大众在 jb 家软件或者 vscode 上,用什么 AI 插件自界说 api 接口的?

    不雅点 5:不错看 awesome-deepseek

    不雅点 6:中国在基础辩论相识滞后,但在哄骗开辟方面如实算遥遥早先

    不雅点 7:600b 对比 300b?过劲

    不雅点 8:绝不夸张地说,Deepseek 是国产开源之光。

    不雅点 9:我前天试用了一下 chat,嗅觉除了推理之外很一般,今天再望望

    不雅点 10:然而 deepseek 提供的 api 速率太慢了,模子提高了 api 速率提高了吗

    不雅点 11:3 倍速率

    不雅点 1:其实最炸场的是它的老师成本,惟有同级别的十分之一以致更低,几乎是工程遗迹

    不雅点 2:国内的大模子一发表等于啥齐最过劲,确凿一用啥也不是

    不雅点 3:deepseek 和 qwen 如实是犀利的,宣传上很谦卑了。其他的差未几就像你说的那样

    不雅点 3:deepseek 和 qwen 如实是犀利的,宣传上很谦卑了。其他的差未几就像你说的那样

    不雅点 4:念念知说念大众在 jb 家软件或者 vscode 上,用什么 AI 插件自界说 api 接口的?

    不雅点 5:不错看 awesome-deepseek

    不雅点 5:不错看 awesome-deepseek

    不雅点 6:中国在基础辩论相识滞后,但在哄骗开辟方面如实算遥遥早先

    不雅点 7:600b 对比 300b?过劲

    不雅点 8:绝不夸张地说,Deepseek 是国产开源之光。

    不雅点 9:我前天试用了一下 chat,嗅觉除了推理之外很一般,今天再望望

    不雅点 10:然而 deepseek 提供的 api 速率太慢了,模子提高了 api 速率提高了吗

    不雅点 11:3 倍速率

    不雅点 11:3 倍速率

    步调员梗图

    References

    https://www.solidot.org/story?sid=80163

    https://tech.ifeng.com/c/8fea2BCw2X1

    https://www.163.com/dy/article/JKDPBBSF0531E3NX.html

    https://github.com/thanos-io/thanos

    https://mp.weixin.qq.com/s/uKFqZsNjunIhsyVxF_90P第四色播室

    发布于:广东省