三星推出评估AI模型生产力的平台TrueBench-拓荒牛-软件著作权服务中心-智慧企业-拓荒族

三星推出评估AI模型生产力的平台TrueBench

作者：拓荒牛分类：默认分类 时间：2025-09-30 13:04

软件著作权服务中心-智慧企业 - 服务中心

三星电子公司周四推出了一个旨在评估人工智能（AI）模型在工作环境中的生产力的平台。

这家韩国科技巨头在一份新闻稿中表示，这个名为TrueBench的平台将为企业提供一套全面的指标，以跟踪大型语言模型（LLM）在现实工作场所的生产力。

该公司表示：“最近，随着企业采用人工智能来完成任务，衡量LLM生产力的需求越来越大。然而，现有的基准主要衡量整体表现，大多以英语为中心，仅限于单轮问答结构。”

为了解决这些限制，三星表示，该平台评估与工作相关的任务，包括内容生成和数据分析，分为10个类别和46个子类别。

该服务支持韩语、英语、日语等12种语言。

三星电子设备体验事业部首席技术官Cheun Kyung-whoon表示：“三星研究院通过真实的人工智能经验，带来了深厚的专业知识和竞争优势”我们期待TrueBench能够建立生产力评价标准，巩固三星的技术领先地位。”

阅读(0) 评论(0) 分享(0)

暂无留言