大家好,我是你们的老朋友,一个在财经圈里摸爬滚打多年的笔耕者,今天我们要聊的这个代码,可能对于很多只盯着主板或者创业板的朋友来说,稍微有点陌生,但如果你是人工智能(AI)领域的深度关注者,或者是对新三板转板机制感兴趣的投资者,那你一定对它不陌生。

我们要聊的主角,代码就是836907。
看到这个以“83”开头的代码,老股民一眼就能认出,这是原新三板(全国中小企业股份转让系统)的挂牌公司,836907,正是大名鼎鼎的北京海天瑞声科技股份有限公司(以下简称“海天瑞声”)。
在正式开始深入剖析之前,我得先给各位提个醒:836907是海天瑞声在新三板挂牌时的代码,这家公司已经在2021年8月成功“转板”,登陆了科创板,现在的股票代码是688787,如果你现在在交易软件里输入836907找不到实时行情,别慌,它已经“鸟枪换炮”,去更大的舞台了。
但这并不妨碍我们通过“836907”这个老代码,来复盘这家公司的成长路径,以及它在这个AI狂飙突进的时代里,究竟扮演着怎样一个不可或缺的角色。
揭开面纱:从“836907”到“688787”的进阶之路
我们得聊聊这个“转板”的故事,在中国资本市场,新三板曾经是很多中小科技企业的孵化器,但也因为流动性等问题,让很多企业望而却步,海天瑞声就是从那个“池子”里游出来的“蛟龙”。
当年,836907在新三板挂牌时,就已经是创新层的“优等生”了,它主要从事的是AI训练数据服务,这听起来可能有点枯燥,但请允许我用一个生活中的例子来解释。
想象一下,你养了一只小狗,你想教它“坐下”和“握手”,你手里得有肉干吧?你得一遍遍做动作,给它肉干,奖励它,它才能学会,在这个过程中,肉干就是“数据”,你的训练过程就是“算法模型”的迭代。
把小狗换成ChatGPT,换成Sora,换成你手机里的Siri,它们是超级聪明的“电子狗”,但它们也需要“肉干”,而且是海量的、高质量的“肉干”,海天瑞声,就是那个专门生产、清洗、打包“高级肉干”的工厂。
从836907到688787,这不仅仅是代码的变更,更是资本市场对其商业模式的一种认可,它证明了在这个硬科技当道的时代,哪怕你不是直接造火箭的,只要你给造火箭的人提供足够精密的螺丝钉,你依然能成为资本的宠儿。
AI时代的“卖水人”:海天瑞声到底在做什么?
在财经圈,我们经常听到一个词叫“卖水人”或“卖铲人”,源自当年的美国西部淘金热,最赚钱的往往不是挖金矿的,而是卖铲子和卖水的。
现在的AI行业就是一场巨大的淘金热,百度、腾讯、阿里、字节跳动,还有国外的OpenAI、Google,这些巨头都在疯狂地“挖金子”(开发大模型),而海天瑞声,就是站在旁边,淡定地卖铲子的人。
这把“铲子”具体长什么样呢?
海天瑞声的核心产品是训练数据,这包括智能语音(语音识别、语音合成)、计算机视觉、自然语言处理等领域的训练数据。
举个具体的例子:
你最近肯定体验过各大银行的智能客服,或者用过高德地图里的林志玲语音导航,当你对着手机说话,手机能准确地把你的话转化成文字,或者用甜美的声音读出导航路线,这背后离不开海天瑞声的贡献。
为了让语音识别引擎听懂带有四川口音的普通话,海天瑞声需要去招募成百上千个四川人,让他们在安静的录音棚里朗读各种文本,录制几千个小时的音频,还要有专门的人工标注员,把这些音频中的每一个音节、每一个词切分出来,打上标签。
这个过程,叫做数据标注。
这听起来是不是很像“劳动密集型”产业?没错,早期确实如此,但海天瑞声的厉害之处在于,它把这个看似低端的过程,变成了一个高科技、高门槛的“精密制造”过程。
生活实例:为什么说“数据标注”是AI的“隐形翅膀”?
为了让大家更直观地理解这家公司的价值,我想讲一个我身边朋友的真实故事。
我有个朋友叫老张,他在一家自动驾驶公司做算法工程师,有一次聚会,他跟我吐槽,说他们团队研发的自动驾驶系统在识别“红绿灯”时总是出bug,特别是在暴雨天,或者红绿灯被前车遮挡了一半的时候,系统就会“发懵”。
老张说,他们算法模型已经很牛了,但就是缺一种“特殊场景”的数据,他们需要有人去采集几万张“被遮挡的红绿灯”、“雨夜中的红绿灯”图片,并且要在图片上精确地把红绿灯的位置圈出来,标记出是红灯还是绿灯。
这就是海天瑞声要做的事情。
老张后来联系了海天瑞声,虽然花了不少钱,但很快拿到了一批高质量的定制化数据,两周后,老张兴奋地告诉我,系统的识别率上去了,bug修好了。
这个例子告诉我们什么?
数据质量决定了AI的智商上限。

如果你给AI喂的是“垃圾数据”(比如标注错误的图片,或者嘈杂不清的音频),那么不管你的算法多先进,AI吐出来的结果也一定是“垃圾”,这就是为什么巨头们离不开海天瑞声,因为对于微软、华为这样的公司来说,虽然他们有钱自己招人做标注,但管理一个几万人的标注团队,并保证99.99%的准确率,是一件管理成本极高的事情,不如外包给专业的海天瑞声,既省心又高效。
深度剖析:从新三板“优等生”到科创板的“新贵”
既然聊到了836907这个老代码,我们就得回顾一下它的历史身价。
在新三板时期,海天瑞声就已经因为其独特的业务模式备受关注,当时的新三板流动性相对较差,很多好公司都被“埋没”了,但海天瑞声凭借其硬核的科技属性和稳定的头部客户资源,依然保持了不错的估值。
它的客户名单简直就是一份“科技巨头名人录”:阿里巴巴、腾讯、百度、微软、字节跳动、华为、科大讯飞……这些大厂为了保证自家AI模型的竞争力,对数据供应商的审核标准极高,能进入这个供应链,本身就说明海天瑞森拿到了一张“长期饭票”。
投资从来不是只看过去,更要看未来。
转板到科创板(688787)后,海天瑞声面临着新的机遇和挑战。
机遇在于: 随着AIGC(生成式人工智能)的爆发,对训练数据的需求呈现指数级增长,以前训练一个语音模型可能需要几千小时数据,现在训练像Sora这样的视频生成模型,可能需要数百万小时的视频和文本数据,海天瑞声的市场天花板被打开了。
挑战在于: 竞争格局在变,以前主要是人工标注,现在出现了“合成数据”,简单说,就是用AI来生成数据喂给AI,如果AI能自己生成数据,那海天瑞森这种靠人工采集和标注的公司,会不会被取代?
这就引出了我的个人观点。
投资视角:繁华背后的冷思考与个人观点
作为一名财经观察者,对于海天瑞声(无论是曾经的836907还是现在的688787),我有几个非常鲜明的观点想和大家分享。
不要神话“合成数据”,人工标注依然是“压舱石”。
很多人担心AI会取代数据标注公司,但我认为,至少在未来5-10年内,这不太可能,为什么?因为AI模型存在“幻觉”,如果用有偏差的AI数据去训练新的AI,这个偏差会像滚雪球一样越来越大。
这就好比“近亲繁殖”,生出来的孩子体质会越来越差,必须有人类的真实数据作为“校准器”,海天瑞声积累的十几年的高质量自有版权数据库,就是它的护城河,这不是一朝一夕能被复制的。
警惕“大客户依赖症”。
如果你翻开海天瑞声的财报,你会发现它的前五大客户销售额占比非常高,这在财务上是一个风险点,虽然都是巨头,现金流有保障,但议价权往往在巨头手里,如果某一年字节跳动或者微软调整了算法研发策略,缩减了数据采购预算,海天瑞声的业绩就会直接“变脸”。
观点:三:这是一门好生意,但不是暴利生意。
数据标注行业,本质上还是“人+技术”的服务业,随着AI的发展,虽然效率提升了,但单价也可能面临下降的压力,它不像卖软件那样,边际成本几乎为零,每多一份订单,就需要多一个人工去处理,在投资这类公司时,不要指望它能像茅台那样拥有超高的毛利率,要关注它的管理效率和人均产出。
从836907看中国资本市场的成熟。
我想跳出公司本身,聊聊代码,836907成功转板,其实给新三板里的那些“专精特新”小巨人打了一针强心剂,它说明,只要你真的有技术,真的在产业链里有不可替代的位置,无论你在哪个池子里,金子总会发光的,这对于我们在一级市场或者新三板淘金的投资者来说,是一个非常重要的选股逻辑:不要只看代码在哪里,要看业务在产业链的什么位置。
在喧嚣中寻找确定性
回到最初的问题,“836907是什么股票?”
它不仅仅是一个代码,它是中国AI产业基础设施的一个缩影,它代表了那些在聚光灯之外,默默为人工智能大厦添砖加瓦的“隐形冠军”。
在这个充满炒作和概念的股市里,我们很容易被各种“元宇宙”、“Web3.0”的概念冲昏头脑,但真正的投资,往往需要回归常识。
常识告诉我们:人工智能要想落地,必须吃高质量的“粮食”,海天瑞声就是那个种粮、磨面的人。
持有这只股票(无论是过去还是现在)并不是没有风险,技术的迭代、大客户的压价、市场的波动,都是悬在头顶的达摩克利斯之剑,但在我看来,只要我们对“更智能的未来”这一大趋势不悲观,海天瑞声这类公司就始终拥有一席之地。
希望这篇文章能帮你解开关于836907的疑惑,也能让你在看懂AI热潮的同时,看到背后那些更实在的商业逻辑,投资路上,我们不仅要学会仰望星空看概念,更要学会脚踏实地看财报、看业务。
毕竟,只有当潮水退去,我们才知道谁在裸泳,而谁在真正地卖铲子。

