腾讯宣布：开源全球最大甲骨文多模态数据-企鹅腾飞的专栏

腾讯宣布：开源全球最大甲骨文多模态数据

2024-07-06 09:04:45栏目：默认栏目 IP属地：IP未知

新浪科技

　新浪科技讯 7月5日下午消息，2024世界人工智能大会（WAIC 2024）期间，腾讯公布大模型的最新进展和落地案例。现场，“数字甲骨共创中心”宣布将全球最大的甲骨文多模态数据集正式开源。

　　据悉，数字甲骨共创中心由安阳师范学院甲骨文信息处理教育部实验室、腾讯SSV数字文化实验室、腾讯优图实验室等多方共同发起建立，该数据集包含一万片甲骨的拓片、摹本，以及甲骨单字对应位置、对应字头、对应隶定字以及辞例分组、释读顺序等数据。基于该数据集，研究人员可开发甲骨文检测、识别、摹本生成、字形匹配以及释读等方向的智能算法，助推甲骨文研究加速数字化和智能化。

　　腾讯集团副总裁蒋杰表示，腾讯将人工智能视为公司长期战略。从语音到图像，再到大模型，每一次人工智能的浪潮里，腾讯始终坚持以自主技术创新为核心动力，结合场景推动AI的研究与落地。经过近一年的迭代升级，腾讯混元大模型在国内率先采用MoE架构，参数量已达到万亿，tokens数量超过7万亿，居国内大模型第一梯队。腾讯将发挥“专心致志、做好比特”的专长，将更多的“比特”转化成智能生产力，推动大模型等前沿人工智能技术在实体经济、文化保护、科学发现等领域的应用，为全社会的智能升级做好技术支持。

　　据悉，腾讯混元大模型的单日调用Tokens已经达到千亿级别，单日调用次数超过3亿，并在云上新开放了混元-lite 256k版本、vision多模态版本，以及代码生成、角色扮演、functioncall等子模型和接口，满足不同企业和开发者的需求。（罗宁）