工联院大模型测评:国内头部大模型表现与GPT3.5相当
近期,中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。评测对象涵盖GPT4、GPT3.5、文心一言、ChatGLM等国内外大模型。
结果显示,GPT4表现最佳。国内头部大模型表现亮眼,整体与GPT3.5相当,其中百度文心一言表现超过GPT3.5。

近期,中国工业互联网研究院针对人工智能大模型在中文工业领域的知识问答能力进行系统性评测。评测对象涵盖GPT4、GPT3.5、文心一言、ChatGLM等国内外大模型。
结果显示,GPT4表现最佳。国内头部大模型表现亮眼,整体与GPT3.5相当,其中百度文心一言表现超过GPT3.5。