闲社
标题:
实测国产大模型:昆仑万维Skywork-13B,中文理解力意外能打
[打印本页]
作者:
aiwoai
时间:
2 小时前
标题:
实测国产大模型:昆仑万维Skywork-13B,中文理解力意外能打
兄弟们,今天不吹不黑,实测了一把昆仑万维开源的Skywork-13B-base模型,聊聊真实体感。
先说结论:中文长文本理解这块,比Meta的Llama-2-13B强出一截,甚至在某些任务上追平了Qwen-14B。具体测试跑了几个场景:一是古文理解,喂了一段《史记》节选,Skywork能准确抓取“太史公曰”的褒贬立场,而Llama-2直接跑偏。二是多轮对话记忆,上下文窗口8K,实测第5轮问答时还能记住前3轮的关键实体,没有出现“失忆”现象。
技术细节上,Skywork用了deepspeed+flash attention优化,推理速度比原生LLaMA快了约15%,显存占用也低。不过短板也有:代码生成能力偏弱,写个Python爬虫脚本逻辑漏洞比较多,数学推理也一般,解初中奥数题容易中途算错。
实用建议:如果你主要做中文NLP任务(如舆情分析、文本生成),可以试试这个基座微调。但别指望它当编程助手。建议配合LangChain做流程优化,或者用LoRA微调特定领域。开源地址在GitHub,感兴趣的自己拉代码跑跑看。
欢迎光临 闲社 (https://www.xianshe.com/)
Powered by Discuz! X5.0