,百川智能今日宣布推出Baichuan2-53B闭源大模型,全面升级了Baichuan-53B的各项能力。 据介绍,Baichuan2-53B不仅数学和逻辑推理能力提升显著,还通过高质量数据体系和搜索增强极大降低了模型幻觉,号称是“目前国...
,百川智能今日宣布推出Baichuan2-53B 闭源大模型,全面升级了 Baichuan-53B 的各项能力。
据介绍,Baichuan2-53B 不仅数学和逻辑推理能力提升显著,还通过高质量数据体系和搜索增强极大降低了模型幻觉,号称是“目前国内幻觉问题最低的大模型”。
百川智能此次还开放了 Baichuan2-53B API 接口,正式进军 To B 领域,开启商业化进程。
IT之家查询发现,Baichuan2-53B 是百川智能发布的第 6 款大模型,自 4 月 10 日成立以来,百川智能平均每 28 天推出一个大模型。
百川智能表示,在 Baichuan-53B 的基础上,Baichuan2-53B 不仅重点强化了以上两个维度的能力,并且对整体能力进行了全面升级。其中,逻辑推理能力提升 100%,数学能力提升 31%,语言理解能力提升 29%,文本创作提升 18%,知识问答提升 9%。
Baichuan2-53B 在幻觉处理方面也进行了优化。高质量数据构建方面,Baichuan2-53B 号称“独创了一套数据质量体系”。以低质、优质为标准将数据进行分类,确保模型始终使用优质数据进行预训练。
信息获取方面,Baichuan2-53B 对多个模块进行了升级,包括指令意图理解、智能搜索和结果增强等关键组件。这一综合体系通过深入理解用户指令,精确驱动查询词搜索,最终结合大语言模型技术,优化模型结果生成的可靠性,实现更精确、更智能的模型回答结果,减少模型幻觉。
百川智能使用 FacTool 评测后的结果显示,Baichuan2-53B 综合得分为 140.5,在主流基础大模型中仅排在 GPT-4 之后。
IT之家注:FacTool 是由上海交通大学、卡内基梅隆大学、香港城市大学、Meta 等机构研究人员提出的一款通用框架,能够查核大模型生成内容的事实准确性。
除了能力全面升级,Baichuan2-53B 还开放了 API 接口,企业和开发者可以通过 API 将 Baichuan2-53B 集成至他们的应用程序和服务中。IT之家查询发现,Baichuan2-53B 的 API 调用服务采用按照时间段分档收费的方式:
-
每日的 8:00 至 24:00,按照每千 tokens 0.02 元的方式收费;
-
每日的 00:00 至 8:00 期间,按照每千 tokens 0.01 元的方式收费。
免责声明:该文章系本站转载,旨在为读者提供更多信息资讯。所涉内容不构成投资、消费建议,仅供读者参考。