近日,AI训练数据解决方案提供商海天瑞声发布了其2024年度的业绩快报,数据亮眼,引发业界广泛关注。
据快报显示,海天瑞声在过去一年中实现了营业收入2.37亿元,与前一年相比增长了39.46%,这一成绩无疑为其在AI数据服务领域的地位增添了重量。同时,公司的归母净利润达到了1121.5万元,成功实现了同比扭亏为盈,这一转变无疑为投资者和市场带来了极大的信心。
海天瑞声自2005年成立以来,一直专注于为AI企业和研发机构提供高质量的数据集及服务。其客户群体涵盖了阿里巴巴、腾讯、字节跳动等国际国内知名科技巨头,以及微软、亚马逊等全球科技领导企业。凭借多年的积累和技术实力,海天瑞声在AI数据服务领域树立了良好的口碑。
谈及营收增长的原因,海天瑞声表示,这主要得益于大模型技术的快速发展以及应用场景的不断拓展。随着智能终端厂商和科技互联网公司的崛起,这些科技巨头们纷纷加大了对多模态数据的投入,以支撑其在智能终端、内容生成等领域的AI能力建设。在此背景下,海天瑞声所提供的多语种、多音色智能语音业务,以及指令微调、偏好对齐等自然语言业务需求呈现出了大幅增长的趋势。
海天瑞声还提到了DeepSeek模型对数据需求的影响。据该公司透露,DeepSeek-V3模型在预训练阶段所使用的token数量远超GPT4等同类大模型,这进一步凸显了海量、高质量数据对于基础模型能力提升的重要性。海天瑞声认为,DeepSeek模型的出现将有助于推动AI模型向产业端发展,而这一过程中将需要更多的数据以及数据专家的参与。
值得注意的是,海天瑞声在智能化标注方面也取得了显著的进展。该公司表示,随着AI大模型的快速发展,数据服务行业对智能化标注的要求和需求不断提升。为此,海天瑞声已经在多数场景下引入了智能化标注技术,通过算法进行预先标注,实现了高效的人机协同。这一技术的应用不仅提高了标注效率,也进一步提升了数据的质量。
为了满足日益增长的市场需求,海天瑞声还进一步扩大了其AI相关业务规模。近日,河北省数海数据科技有限公司正式成立,该公司由海天瑞声等共同持股,经营范围涵盖了人工智能应用软件开发、人工智能基础软件开发以及人工智能理论与算法软件开发等多个领域。这一举措无疑为海天瑞声的未来发展注入了新的动力。