Qwen1.5-MoE实测：代码生成、文本创作、信息提取效果如何？-大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发

文章编号：4960 / 分类：AI资讯 / 更新时间：2024-06-16 10:00:01 / 浏览：次

Qwen1.5-MoE实测：、文本创作、信息提取效果如何？-大知识库|大训练|开箱即用的企业大应用平台|智能体开发

53AI知识库

学习大模型的前沿技术与行业应用场景

在开发针对特定细分场景的AI应用时，我们需要对备选模型在这些场景下的性能进行细致的测试，以确定模型的能力边界，才能知道这个模型是否真的适合用在这个场景上。

而当前，不管是开源或者闭源模型，模型更新的速度很快，几乎每天都有新的模型版本发布。

为了提升模型实测环节的效率，SOTA平台每日会更新包括Llama3、Yi-1.5、DeepSeek等在内的最新热门开源模型的实测案例，作为大家了解模型实际能力的基础。

我们的测试案例会涵盖代码、逻辑与推理、角色扮演、内容生成与创作等常见应用场景。

下面是Qwen1.5-MoE-A2.7B在代码生成、文本创作、JSON格式提取、信息提取的表现展示（附上模型部署环境、推理效率）。Qwen1.5-MoE-A2.7B采用混合专家 (MoE) 架构，其中的模型由密集语言模型升级而来，Qwen1.5-MoE-A2.7B是从升级而来Qwen-1.8B。它总共有143亿个参数，运行时有27亿个激活参数。

Qwen1.5-MoE在代码生成任务中的表现总体较好，生成的俄罗斯方块游戏代码框架较为完整，展示了如何使用pygame库来创建游戏窗口、处理用户输入和绘制图形等基本功能，体现了一定的实用性。然而，该输出存在一些不足之处，如没有完整的代码实现，仅提供了框架，缺少游戏逻辑的具体实现和注释，可能需要用户具备较强的编程基础才能继续完善。此外，代码格式稍显凌乱，可读性有待提高。

Qwen1.5-MoE在Json格式提取任务中，成功提取了文本中的关键信息并以结构化的Json格式表示：公司地址、业务目标、团队构成和产品预期等主要内容。然而，输出中的不足在于，部分字段信息不够准确，如“革命性”和“贡献”字段的表达模糊，有待进一步优化。此外，字段命名和层次结构可以更精细，以提高可读性和逻辑性。

Qwen1.5-MoE在信息提取任务中，可以准确地提取了对话中的关键时间、地点和事件信息。然而，生成结果存在一些可以提升的点，如对事件的描述过于笼统，未能将面试这个场景下，关键的准备事项这个细节体现出。

以上是Qwen1.5-MoE在代码生成、文本创作、JSON格式提取、信息提取场景的表现。

完整实测案例可通过以下链接或「阅读原文」访问：

如果你想优先知道哪些LLM的实际性能，或者反馈功能or内容，欢迎告诉我们~

53AI，大模型落地应用首选服务商

定位：开箱即用的大模型落地应用平台

承诺：先做场景POC验证，看到效果再签署服务协议。零风险落地应用大模型，已交付160+中大型企业

微软技术社区：做RAG？向量搜索还不够

全球首个开源AIGC数字人模型免费使用，手机端可跑！

如何让AI基于超长文档进行问答？

翻车了？这才是真正的SD3！

Omost！让AI大模型代写AI绘画提示词

《构建和评估高级RAG》: RAG评估要素和方法

【AI大模型应用开发】AI+知识图谱极简入门：手把手带你体验LangChain实现知识图谱创建和查询（附代码和源码分析）

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）杨小姐 186 6662 7370

上海：上海市浦东新区金新路58号1602室戴先生 186 1639 7587

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）杨小姐 186 6662 7370

上海：上海市浦东新区金新路58号1602室戴先生 186 1639 7587

与创始人交个朋友

-->广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）杨小姐 186 6662 7370

上海：上海市浦东新区金新路58号1602室戴先生 186 1639 7587

-->