腾讯宣布:开源全球最大甲骨文多模态数据
新浪科技
新浪科技讯 7月5日下午消息,2024世界人工智能大会(WAIC 2024)期间,腾讯公布大模型的最新进展和落地案例。现场,“数字甲骨共创中心”宣布将全球最大的甲骨文多模态数据集正式开源。
据悉,数字甲骨共创中心由安阳师范学院甲骨文信息处理教育部实验室、腾讯SSV数字文化实验室、腾讯优图实验室等多方共同发起建立,该数据集包含一万片甲骨的拓片、摹本,以及甲骨单字对应位置、对应字头、对应隶定字以及辞例分组、释读顺序等数据。基于该数据集,研究人员可开发甲骨文检测、识别、摹本生成、字形匹配以及释读等方向的智能算法,助推甲骨文研究加速数字化和智能化。
腾讯集团副总裁蒋杰表示,腾讯将人工智能视为公司长期战略。从语音到图像,再到大模型,每一次人工智能的浪潮里,腾讯始终坚持以自主技术创新为核心动力,结合场景推动AI的研究与落地。经过近一年的迭代升级,腾讯混元大模型在国内率先采用MoE架构,参数量已达到万亿,tokens数量超过7万亿,居国内大模型第一梯队。腾讯将发挥“专心致志、做好比特”的专长,将更多的“比特”转化成智能生产力,推动大模型等前沿人工智能技术在实体经济、文化保护、科学发现等领域的应用,为全社会的智能升级做好技术支持。
据悉,腾讯混元大模型的单日调用Tokens已经达到千亿级别,单日调用次数超过3亿,并在云上新开放了混元-lite 256k版本、vision多模态版本,以及代码生成、角色扮演、functioncall等子模型和接口,满足不同企业和开发者的需求。(罗宁)