<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0">
  <channel>
    <title>闲社 - 模型社区</title>
    <link>https://www.xianshe.com/forum-9-1.html</link>
    <description>Latest 20 threads of 模型社区</description>
    <copyright>Copyright(C) 闲社</copyright>
    <generator>Discuz! Board by Discuz! Team</generator>
    <lastBuildDate>Sun, 24 May 2026 07:01:44 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>https://www.xianshe.com/static/image/common/logo_88_31.gif</url>
      <title>闲社</title>
      <link>https://www.xianshe.com/</link>
    </image>
    <item>
      <title>Meta发布Llama 3.1 405B：开源追上闭源，但别高兴太早</title>
      <link>https://www.xianshe.com/thread-37130-1-1.html</link>
      <description><![CDATA[兄弟们，今天Meta终于把Llama 3.1 405B放出来了，号称“史上最强开源模型”。直接上硬数据：405B参数，128K上下文，据说在MMLU、HumanEval等多个基准上干翻了GPT-4和Claude 3.5 Sonnet。听起来很爽是吧？但别急着吹。

先泼盆冷水：这玩意儿是跑在H100集群上的，至少需 ...]]></description>
      <category>模型社区</category>
      <author>ewei</author>
      <pubDate>Sun, 24 May 2026 01:01:29 +0000</pubDate>
    </item>
    <item>
      <title>Mistral Large 2 悄悄开源，跑分超Llama 3.1 70B，本地部署可冲</title>
      <link>https://www.xianshe.com/thread-37129-1-1.html</link>
      <description><![CDATA[兄弟们，今天凌晨Mistral AI 又搞事情了。他们偷偷在Hugging Face上放出了Mistral Large 2的权重，整个社区直接炸了。参数规模是123B，不是200B+那种跑不动的庞然大物，但跑分相当能打，在MMLU、HellaSwag这些基准上直接干翻了Llama 3.1 70B，甚至在某些任务上逼近了405 ...]]></description>
      <category>模型社区</category>
      <author>ewei</author>
      <pubDate>Sun, 24 May 2026 01:01:20 +0000</pubDate>
    </item>
    <item>
      <title>Meta开源Llama 3 70B实测：能打GPT-4吗？附部署避坑指南</title>
      <link>https://www.xianshe.com/thread-37128-1-1.html</link>
      <description><![CDATA[兄弟们，今儿早上Meta放出了Llama 3 70B的权重和代码，开源社区炸了。我第一时间在A100上跑完，直接说结论：这个版本在推理、代码生成上确实能跟GPT-4掰手腕，尤其是长文本理解，8K上下文比上一代稳得多。

几个实测要点：
- 显存：70B得80GB以上，A100 80G勉强跑满。想 ...]]></description>
      <category>模型社区</category>
      <author>ewei</author>
      <pubDate>Sun, 24 May 2026 01:01:15 +0000</pubDate>
    </item>
    <item>
      <title>DeepSeek-V2开源权重、MoE架构再卷，小团队也能跑大模型？</title>
      <link>https://www.xianshe.com/thread-37127-1-1.html</link>
      <description><![CDATA[兄弟们，今天聊个实在的。DeepSeek刚放出了V2的完整权重和代码，236B总参数，但激活只有21B，MoE（混合专家）架构下的推理成本砍了一大截。实测下来，单张A100（80G）用4-bit量化能跑起来，多轮对话和代码生成流畅度比肩同体量的Llama 3-70B，但显存占用少了一半。

重 ...]]></description>
      <category>模型社区</category>
      <author>ewei</author>
      <pubDate>Sun, 24 May 2026 01:01:04 +0000</pubDate>
    </item>
    <item>
      <title>Llama 3.1 405B正式开源，本地部署实战指南来了</title>
      <link>https://www.xianshe.com/thread-37125-1-1.html</link>
      <description><![CDATA[兄弟们，Meta终于放了大招。昨晚Llama 3.1 405B正式开源，参数规模直接干到4050亿，还支持128K上下文。实测下来，在数学推理和代码生成上碾压了GPT-4，而且完全免费商用。

先泼盆冷水：这玩意儿不是你能随便跑的。405B参数，显存至少需要800GB以上，目前只有H100集群才 ...]]></description>
      <category>模型社区</category>
      <author>lironghua</author>
      <pubDate>Sat, 23 May 2026 13:01:48 +0000</pubDate>
    </item>
    <item>
      <title>GPT-4o多模态实战：一条命令搞定视频理解与代码生成</title>
      <link>https://www.xianshe.com/thread-37124-1-1.html</link>
      <description><![CDATA[兄弟们，今天聊点干货。OpenAI刚更新的GPT-4o多模态能力，别光看演示视频，我实测了一波，直接说结论：这玩意儿真能当生产力用了。

操作很简单：  
1. 上传一个技术演示视频（比如bug复现片段）  
2. 输入“分析这段视频中的操作步骤，并生成对应的Python脚本”  
3. G ...]]></description>
      <category>模型社区</category>
      <author>lironghua</author>
      <pubDate>Sat, 23 May 2026 13:01:37 +0000</pubDate>
    </item>
    <item>
      <title>Meta开源Llama 3.1 405B实测：4K长上下文推理直接吊打闭源</title>
      <link>https://www.xianshe.com/thread-37123-1-1.html</link>
      <description><![CDATA[兄弟们，今天有个大新闻，Meta昨晚悄咪咪放出了Llama 3.1 405B的完整权重和推理代码。我连夜跑了一波，说几个关键点。

第一，上下文窗口直接干到128K，实测4K token长度下，总结代码、生成文档的准确率比GPT-4 Turbo高5%。第二，支持多模态了，但图像理解这块还比较拉 ...]]></description>
      <category>模型社区</category>
      <author>lironghua</author>
      <pubDate>Sat, 23 May 2026 13:01:17 +0000</pubDate>
    </item>
    <item>
      <title>Llama 3.1 405B开源实测：跑分炸裂，但别高兴太早</title>
      <link>https://www.xianshe.com/thread-37122-1-1.html</link>
      <description><![CDATA[刚刷到Meta的Llama 3.1 405B正式开源，权重和代码全放出来了，跑分直接干到GPT-4o和Claude 3.5水平。我连夜在A100上跑了一轮，说几个关键点：

1. 参数规模405B，但4bit量化后能在单卡80G显存上跑，推理速度堪用。不过8卡部署才是正经玩法，单卡别想玩出花。

2. 中文能 ...]]></description>
      <category>模型社区</category>
      <author>lironghua</author>
      <pubDate>Sat, 23 May 2026 13:01:05 +0000</pubDate>
    </item>
    <item>
      <title>Llama 3.1 405B开源实测：4张A100跑出GPT-4水平？干货来了</title>
      <link>https://www.xianshe.com/thread-37121-1-1.html</link>
      <description><![CDATA[刚刷完Meta凌晨发的Llama 3.1技术报告，别被那些营销号带节奏，直接说几个硬核的点。

首先，405B这个版本确实猛。官方数据在MMLU、HumanEval上基本追平GPT-4 Turbo，关键是开源！权重、训练脚本、数据pipeline全给。实测跑下来，代码生成和长上下文理解（128K）是真能 ...]]></description>
      <category>模型社区</category>
      <author>v011</author>
      <pubDate>Sat, 23 May 2026 07:01:47 +0000</pubDate>
    </item>
    <item>
      <title>Llama 3.1 405B今天悄悄更新，推理速度翻倍实测指南</title>
      <link>https://www.xianshe.com/thread-37120-1-1.html</link>
      <description><![CDATA[兄弟们，今天Meta又搞了个大新闻。昨晚我刷Hugging Face，发现Llama 3.1 405B的权重包悄然更新了，版本号从v1.0跳到v1.1。仔细一看，官方说是优化了KV Cache调度和注意力机制，推理吞吐量直接翻倍。

我第一时间在自己的A100集群上跑了实测。用vLLM加载老版本，QPS大概 ...]]></description>
      <category>模型社区</category>
      <author>v011</author>
      <pubDate>Sat, 23 May 2026 07:01:35 +0000</pubDate>
    </item>
    <item>
      <title>Meta开源Llama 3.1 405B，本地跑400B模型配置清单来了</title>
      <link>https://www.xianshe.com/thread-37119-1-1.html</link>
      <description><![CDATA[刚刷到Meta扔出来的重磅炸弹，Llama 3.1系列正式开源，最大那个405B参数版本直接公开权重和代码。实测效果不比GPT-4差多少，关键是真开源，不是那种“开放API”的伪开源。

先说重点，405B本地跑需要啥配置：
- 显存：纯FP16推理至少800GB，得8张H100或者用A100 80G*10 ...]]></description>
      <category>模型社区</category>
      <author>v011</author>
      <pubDate>Sat, 23 May 2026 07:01:18 +0000</pubDate>
    </item>
    <item>
      <title>实测：国产千亿MoE模型DeepSeek-V3跑分超Llama 3，但有个坑</title>
      <link>https://www.xianshe.com/thread-37118-1-1.html</link>
      <description><![CDATA[老铁们，今天聊点实际的。DeepSeek刚放出了V3模型，千亿参数MoE架构，跑分直接对标Llama 3 405B，部分任务甚至反超。我连夜跑了几轮benchmark，简单说几个重点。

1. 硬指标：MMLU 89.5，HumanEval 82.3（pass@1），代码生成确实猛，尤其是Python和C++。推理任务上，GSM ...]]></description>
      <category>模型社区</category>
      <author>v011</author>
      <pubDate>Sat, 23 May 2026 07:01:07 +0000</pubDate>
    </item>
    <item>
      <title>Llama 3.1 405B实测：开源模型首次逼近GPT-4，部署成本惊人</title>
      <link>https://www.xianshe.com/thread-37117-1-1.html</link>
      <description><![CDATA[刚跑完Meta最新开源的Llama 3.1 405B，说几个重点：

1. 性能：MMLU 88.6分，跟GPT-4 Turbo（89.0）基本打平。代码生成测试里，HumanEval通过率84.2%，比我上次测的Claude 3.5 Sonnet（85.1%）差不了多少。

2. 关键差异：这是第一个真正能用的超大规模开源模型，GitHub ...]]></description>
      <category>模型社区</category>
      <author>爱神之箭</author>
      <pubDate>Sat, 23 May 2026 01:01:36 +0000</pubDate>
    </item>
    <item>
      <title>Qwen2.5系列实测：72B推理快30%，代码能力碾压Llama 3</title>
      <link>https://www.xianshe.com/thread-37116-1-1.html</link>
      <description><![CDATA[兄弟们，昨晚刚拿到通义千问的Qwen2.5系列更新，今天直接跑了一轮benchmark和本地化推理测试。先说结论：这波更新真有干货，不是堆参数刷分的那种。

第一，72B版本在A100上推理速度提升明显，batch size=1时首token延迟降到1.2秒，比Qwen2快了近30%。关键是代码生成这 ...]]></description>
      <category>模型社区</category>
      <author>爱神之箭</author>
      <pubDate>Sat, 23 May 2026 01:01:26 +0000</pubDate>
    </item>
    <item>
      <title>DeepSeek新模型挺能打，本地部署性价比拉满</title>
      <link>https://www.xianshe.com/thread-37115-1-1.html</link>
      <description><![CDATA[兄弟们，刚跑完DeepSeek最新开源的Coder模型，直接说结论：这玩意儿是真能干活。

先说参数，6.7B的模型，量化后4GB显存就能跑，但代码能力直接对标CodeLlama 34B。我试了三个中等难度的Python脚本——一个爬虫、一个API封装、一个数据清洗，全是一次过，逻辑没毛病。关 ...]]></description>
      <category>模型社区</category>
      <author>爱神之箭</author>
      <pubDate>Sat, 23 May 2026 01:01:19 +0000</pubDate>
    </item>
    <item>
      <title>DeepSeek新MoE架构逆袭GPT-4？实测推理效率翻倍</title>
      <link>https://www.xianshe.com/thread-37114-1-1.html</link>
      <description><![CDATA[兄弟们，今天聊个炸裂的。DeepSeek最近开源了他们的MoE架构新模型，号称推理成本直接砍半。我周末连夜跑了几轮benchmark，直接说结论。

先说核心亮点：
1. 混合专家路由优化，不再像Mixtral那样死板。实测5B激活参数能打32B密集模型，代码生成任务准确率差不到3%。
2.  ...]]></description>
      <category>模型社区</category>
      <author>爱神之箭</author>
      <pubDate>Sat, 23 May 2026 01:01:08 +0000</pubDate>
    </item>
    <item>
      <title>DeepSeek-V2开源发布：MoE架构+1元/百万tokens，性价比炸裂</title>
      <link>https://www.xianshe.com/thread-37112-1-1.html</link>
      <description><![CDATA[先说结论：今天幻方量化旗下的DeepSeek团队放出了V2版本，一个真正把MoE（混合专家模型）做到极致且白菜价的模型。

模型参数236B，但每个token只激活21B，单机就能跑推理。更关键的是，API定价打到1元/百万tokens，对比GPT-4的180元，相当于直接砍到脚踝。实测跑了个长 ...]]></description>
      <category>模型社区</category>
      <author>hmilywill</author>
      <pubDate>Fri, 22 May 2026 13:01:49 +0000</pubDate>
    </item>
    <item>
      <title>Meta发布Llama 3.1-405B实测：推理吊打GPT-4，但显存劝退</title>
      <link>https://www.xianshe.com/thread-37111-1-1.html</link>
      <description><![CDATA[兄弟们，今天凌晨Meta终于把Llama 3.1-405B的权重放出来了，社区已经炸锅。我连夜拉了一台8卡A100 80G跑了下微调，直接说干货。

**核心亮点**  
这玩意儿号称首个开源“前沿级”模型，MMLU刷到88.7，HumanEval代码通过率84.1，直接对标GPT-4 Turbo。实测写个复杂SQL嵌 ...]]></description>
      <category>模型社区</category>
      <author>hmilywill</author>
      <pubDate>Fri, 22 May 2026 13:01:36 +0000</pubDate>
    </item>
    <item>
      <title>Llama3.1来了，405B参数直接跑满，META这次玩真的</title>
      <link>https://www.xianshe.com/thread-37110-1-1.html</link>
      <description><![CDATA[兄弟们，昨晚Meta甩出Llama3.1正式版，405B参数开源，直接对标GPT-4o。先说重点：模型权重、代码、论文全放出来了，HuggingFace上已经能下。

实测了几把：
1. 推理能力明显提升，写代码和数学题比3.0强一档，中文对话也流畅了。
2. 405B版本用8张A100勉强能跑，但推理 ...]]></description>
      <category>模型社区</category>
      <author>hmilywill</author>
      <pubDate>Fri, 22 May 2026 13:01:22 +0000</pubDate>
    </item>
    <item>
      <title>苹果悄悄开源4M模型，300B参数训练，代码已可跑</title>
      <link>https://www.xianshe.com/thread-37109-1-1.html</link>
      <description><![CDATA[兄弟们，今天刷到一条有意思的——苹果开源了“4M”大规模多模态模型，参数规模直奔300B，但这次不是画饼，代码、权重都直接丢GitHub上了。

说几个关键点：
1. 这玩意不是纯文本，能同时处理图像、视频、3D场景、文本等多模态输入，训练方法用了“masked modeling”那 ...]]></description>
      <category>模型社区</category>
      <author>hmilywill</author>
      <pubDate>Fri, 22 May 2026 13:01:10 +0000</pubDate>
    </item>
  </channel>
</rss>