走进山东高知数据产业有限公司,多名临床医学毕业生正凝神屏息,为CT影像中的病灶勾勒边界。他们笔下的每一次标注,都将成为AI诊断的关键依据。这家公司刚落户济南不久,已经把业务迅速开展起来。
与此同时,山东千澄信息科技有限公司内,一群年轻员工正紧盯电脑屏幕,用软件工具处理3D车库雷达影像,鼠标拖动线条标注柱子、墙体、汽车轮廓等画面。这些被“翻译”的数据,是训练智能驾驶系统的核心语料。
人工智能技术飞速迭代,需要海量的标注数据作为“燃料”。数据标注因其劳动密集的属性,常被视为产业链的“低端环节”,由此成为一些地区实现促进就业和乡村振兴的有效途径。这一固有印象,正被济南的选择打破。
今年8月底,《济南市数据标注产业发展行动方案(2025—2026年)》正式印发。这座志在数字浪潮中扮演引领者角色的城市,不仅没有忽视数字标记“基础环节”,反而要整合资源,将其提升至战略高度,系统推进。济南为何要重点布局这一产业?其背后的逻辑值得深探。
数据标注(图片由AI生成)
01 数据标注产业正在起变化
顾名思义,数据标注就是对未经处理的原始数据添加说明、解释、分类或编码的过程,以便数据可以被人工智能算法所理解和使用。
随着人工智能技术快速发展,高质量数据集成为推动生成式人工智能创新发展的核心稀缺要素。近年来,《新一代人工智能发展规划》《“十四五”数字经济发展规划》《关于促进数据标注产业高质量发展的实施意见》《“数据要素×”三年行动计划(2024—2026年)》等系列文件密集出台,显示国家层面正积极引导数据要素价值释放。
公众对数据标注产业存在一种普遍印象——技术门槛低,似乎只需配备一台电脑,人人都能干起来。实际上,在国家战略布局和大模型技术突破的双重驱动下,数据标注产业正在经历从劳动密集型向知识密集型的深刻转型。当前,数据标注产业正处于转型升级的关键阶段,呈现高技术含量、高知识密度、高应用价值的“三高”特征。
济南要抢抓的就是这一新机遇。
国家超算济南中心
济南拥有国家数据要素综合试验区核心区、国家人工智能创新应用先导区、国家新一代人工智能创新发展试验区和国家工业互联网建设示范区的“四区叠加”战略优势。这一独特地位为济南发展数据标注产业提供了坚实基础。
02 拓宽差异化发展路径
根据GrandViewResearch的报告,全球数据标注市场预计到2030年将达到171亿美元,是2024年规模的5倍以上。随着自动驾驶、智能医疗、语音识别等领域的蓬勃发展,数据处理需求持续攀升。北美是最大市场,亚太地区则被预测为增长最快的区域。
公开信息显示,2025年中国AI基础数据服务市场规模为75亿元,未来5年复合增长率30.4%。数据标注工厂正脱胎为AI基础设施的一部分。
“可以说,AI技术发展到哪一步,数据标注服务就需要跟进服务到哪一步,这就是济南积极布局高端数据标注产业的原因。”济南市大数据局数字科技和基础设施建设处相关负责人透露。
济南数据标注产业发展的核心是构建全域协同、特色鲜明、优势互补的“1+8+N”产业体系。
“1”是指建设“统一语料服务平台”;“8”是指布局八个数据标注园区;“N”是围绕工业制造、医疗健康、文化旅游等多个领域建设行业高质量数据集,深度挖掘应用场景和数据价值潜能。
这一布局体现了济南差异化发展的思路,综合型、特色型园区并举,引导各区县立足自身产业基础,避免同质竞争。
目前,济南数据标注产业仍处于“企业规模小、服务能力弱、资源分散”的初级阶段,但已展现出强劲发展势头。在龙头企业带动下,产业集聚效应开始显现。在历下区医疗数据标注产业基地,山东宣驰信息科技有限公司现已成功培育出7家企业,从业人员300多人,预计到明年年底能达到1500人的规模。
济南已在数据标注领域涌现出宣驰信息、魔门网络、四维云科、千澄信息等多家重点企业,还有更多企业正处于组队接单的初创期,相关企业主要分布在历下区、高新区、章丘区、济阳区。
位于济南高新区新泺大街的山东省邮电规划设计院是一家深耕行业五十余年的高新技术企业,是国家信息通信建设领域重要的技术支撑服务单位,广泛服务于各通信运营商、政府机关和事业单位。今年,该公司紧锣密鼓加入了数据标注赛道。目前该公司已开辟数据标注基地,首批员工培训后上岗,成功服务多家人工智能、互联网大厂和知名汽车制造商,数据标注项目涉及智能驾驶、医疗、多语言处理等多个领域。预计明年从事数据标注的员工能达到200人。
数据标注流程
“我们始终带着互联网思维来推动数据标注业务,前期我们将借高端数据标注项目进入行业,同步研发智能体,用自动化标注技术提升标注效率,逐渐走上人机协同标注的道路。未来,一定是有核心技术的企业才会在行业竞争中胜出。”山东省邮电规划设计院副总经理薛益透露。
03 打造特色数据标注产业带
未来的竞争将是产业生态的竞争。
此前,济南市大数据局局长张熙曾在接受采访时表示,济南的大模型以及软件产业优势明显,链主企业、龙头企业多,形成具备竞争力的产业生态。当前,各方虽普遍认可数据资源的重要性,但多数主体更愿意为模型、算力买单。各行各业在推动行业大模型应用的过程中,应进一步加大对数据资源的投入,共同培育为优质数据买单的行业共识。
根据《济南市数据标注产业发展行动方案(2025—2026年)》规划,到2026年,济南将引进培育数据标注龙头企业3家以上,培育数据标注企业60家以上,语料数据规模达到2000TB,带动相关产业规模300亿元以上。
济南将智慧医疗、智慧驾驶作为数据标注的重点发展方向,是基于对产业特性的深刻理解。
医疗数据标注专业门槛高、质量要求严和价值密度大,对从业人员的专业背景有严苛要求,而济南恰好拥有实力雄厚的医学高等教育资源。本地企业承接相关项目时,在人才供给方面拥有显著优势。济南计划通过争取卫健系统的支持,发展高价值的医学数据标注业务,并积极参与制定行业的团体标准、地方标准和国家标准。
在智驾数据标注层面,中国自动驾驶技术的快速迭代与应用场景的持续拓展,正催生对高质量训练数据的海量需求。与此同时,车载传感器精度的提升使得数据形态日趋复杂。济南在软件产业和人工智能领域均有深厚积淀,本地信息技术企业早已嵌入华为、比亚迪等大型企业的生态圈中。面对智驾数据标注的复杂需求,济南企业在承接高质量数据标注项目方面展现出独特的区位与产业链协同优势,正在这一赛道建立竞争力。
山东省大数据产业基地
作为省会经济圈核心城市,济南数据标注产业的发展将突破行政区域限制,带动周边城市数据标注产业协同发展,强化区域经济一体化。
鼠标轻点,教AI识别世界。济南的数据标注产业正从零散起步向体系化发展,谋划一场高质量突围。