今年你下单了吗?抢到心仪的商品了吗?快递收得顺利不?血拼了大半个月的我有一个最大的体会,就是今年的618还是那么热闹,但有些东西变了。 让大家高高兴兴购物,支撑亿级用户顺利下单、收货体验的,是一群技术人,他们日复一日地在代码堆里打磨系统、调模型、压成本、提效率。 618是京东的生日,也是京东首次以线上促销形式庆祝这一日期,推出了618年中促销活动,通过限时秒杀等简单玩法吸引消费者。 大家在京东选购商品时可能会留意到,不同商家架上的同类商品会自动被归在一起,方便大家快速对比选购性价比高的商品,商家也会被激励提供更具竞争力的价格和服务。 他2021年从中国科学院自动化研究所博士毕业加入京东,一开始就在做大模型相关的工作。最开始是研究BERT等,case by case地简单修改模型架构、改造模型训练方式。 后来ChatGPT横空出世,他的研究就主要集中在模型压缩和数据自动化选择与配比上,尽可能提高模型训推效率和性能平衡,减少实际应用中的人力和实验成本。 在京东这样一个SKU数量以亿计、电商业务极其复杂的平台上,要让系统自动识别出相同商品,既要精度高,还得成本可控、能大规模运行——难。就连大模型中很“小”的7B模型,使用起来都成本太高、速度太慢,难以支撑实际业务的规模化落地。 小模型学习大模型分辨的结果对错,也学习其内部思考过程,领悟判断逻辑,深入理解什么样的特征才是有用的判断依据。 为此,长林设计了一套数据筛选机制,优先选出那些最有信息量、最难判断的“模糊样本”,这样不仅节省了40%~60%的训练资源,还保持了原有精度。 同时,为了支持多个任务的数据融合训练,他还引入了一种自动数据配比算法,根据不同任务的难度动态调整数据占比,进一步提升了训练效率。 这种在项目推进上的自由度,让长林能够坚持自己的追求——不是堆模型参数赢比赛,而是让技术真正跑进业务、服务用户。如果能让用户更快买到“又好又便宜”的商品,提升一点点体验,降低一点点选择成本,那技术就没白用。 京东对于供应链全流程包括需求预测、采购/供应、仓储/库存、销售、物流履约和客服都有深刻的理解。同时又拥有自营和POP两种完全不同的模式。这会带来很多全新的机会。 像他做的同品判别系统,就是在深入理解商品聚合场景之后,自然浮现出来的方向——既贴近用户体验,又具备模型落地的复杂性,值得长期深耕。 此次618物流大考前夕,星衍的日常有些“不太日常”:他带着团队每隔几小时就查看一次前线实仓的指标、现场监控和异常回报,有时还要一起亲自到实仓去。 当时,星衍在Meta实习,也顺利拿到了研究岗的offer。但“那个岗位其实做的就是写SQL、跑数仓,和博士研究的时空数据分析基本没关系”,而且在星衍看来,国外平台对技术人员的上限不够友好,是不是博士干的活都差不多,没啥挑战。 最终,结合自己的专业方向和技术兴趣,他选定了京东物流作为定岗方向——这是一个看起来“灰尘多、线下多、数据脏”的场景,并且是需要真正的深入业务理解业务场景,在一线、成为一线。 他每天需要考虑和接触得最多的,不是派送件的快递员,就是分拣快递的仓库。这俩一个是物流末端,面对开放环境,一个是封闭场景,复杂度不在一个纬度上,但都不简单。 以前,每个京东快递的站点,是站长靠经验来划分快递员辖区。随着快递体量越来越大,人的主观经验开始吃不消了——既有分配不均的问题,也有反馈难追踪的问题。 于是,星衍带领团队开发了一套智能分区模型,结合快递员画像(如派件量、上楼频率、返站次数)和小区地形信息(是否老旧小区、有无电梯等),帮助末端更合理地分派人力。 而星衍现在正在推动的项目,是部署在京东物流的分拣中心的机械臂,这也是为什么他最近忙得不可开交、动辄要去仓库前线的原因。 从去年开始,星衍带队负责包裹抓取与码放的智能化改造项目,落实到地就是一台台机械臂,负责完成京东仓库中部分中小件包裹的自动分拣、码放工作。 这些机械臂和传统工厂流水线上的机械臂不同,它们是“具身智能”,只不过不是通用型的。而它们和星衍团队的目标,是把“中小件包裹分拣、码放”这个单一场景打透。 “包裹没你想得那么规整,包裹外包装有反光的、黑的,也有两个胶带粘一起的,尺寸大小也不一致。”星衍介绍道,“有一次机械臂遇到一批包裹中间贴了反光胶带,系统误以为那是两个包裹,就导致识别错误。” 具体技术上,星衍团队采用了行业成熟方案加域内微调的模式。这种情况下京东内部积累的海量包裹图像数据就立下了汗马功劳,这都是外部团队很难获得的积累。 作为博士管培生入职后,他从初来乍到的技术新人,到现在带着团队伙伴一起负责核心项目,星衍的成长速度是非常快速的,角色的转型也是他近期的重要课题。 以前是自己调模型、改代码就行,现在是得替大家考虑怎么组织项目、解决问题。如今的星衍,比起一开始那个还带着研究视角的博士,显然多了一些“工程老兵”的理性与判断。 作为京东科技的一员,他参与的语音识别系统,已经深度接入了京东的协同办公、智能客服、AI外呼、语音搜索、具身智能等多个核心业务线。这些业务大家其实早就体验过。 当初刚刚加入京东的时候,技术小兵初雪只是参与着科技业务一些比较底层的小模块的开发调试,比如语音活动检测、VAD、声纹日志。 扎实的经历,让初雪在短短几年中从小模块爬到了大项目——不仅在京东语音能力大项目中担任研发骨干,还开始牵头组内一些新方向的探索和项目落地。像智能外呼系统、远场识别模型、智能客服的语音前端能力,他都参与了完整的方案设计与技术实现。 这些应用,在京东丰富的自有场景里迅速扎根,成长为有成千上万用户、身边朋友家人都会用到的产物。这让初雪从初入行业的技术人才,进化成熟稔产业应用的专家。 他当初经由博士管培生项目招进京东,项目机制成熟:入职前半年打基础,技术大佬+业务大佬直接指导,解答技术问题的同时能够深入业务学习和建立认知,接下来就会进入项目历练,在能落地的技术实践中培养人才,利用技术眼界创造更大的价值。因为每个人都配备了导师,每个人都有清晰的成长路径。 京东在资源上也很支持,“项目落地过程中,只要你能把技术说清楚、效果做出来,公司就愿意投入。京东是一家用产业价值衡量技术的公司。” 当初选择加入京东,除了项目机制成熟,公司资源倾斜,专业方向匹配(他本就是做语音识别方向的博士),还有很现实的考虑:一是初雪是北方人,在北方城市生活更习惯;二是京东福利实在,自己在北京落了户,身边还有很多同事通过公司住房保障基金在北京买房安了家。 初雪回忆道,某年他所在团队揽下了做会议转写系统的任务,但当时市面上已经有成熟产物了,公司内部一直有声音主张直接对外采买。但京东既坐拥丰富的产业数据,又拥有大量的场景需求。当时初雪就觉得,如果这都做不过外部竞品,那我们还有什么价值呢? 于是,他和团队一路从底层模块开始优化,从ASR(自动语音识别)、说话人识别、VAD,一直迭代到后处理文本修复,花了几月时间反复打磨。 应用到京东的业务场景中,咱们普通人最有感知的例子或许是京东智能外呼——电话那头听起来很自然、反应灵活的拟人语音,高效处理海量呼叫任务,介绍最新产物、活动,还能理解客户需求。 针对这个必须解决的问题,初雪和团队专门收集了全国各地的大量样本,还开发了针对性增强机制,比如使用MoE来在不同方言分布之间做切换,从而实现对口音更友好的模型泛化。 除了这些,他也在推动一些更“感知层”的创新方向,比如通过分析语音中的情感、语气波动,判断用户的意图倾向是“犹豫偏正向”还是“犹豫偏负向”。 你不能只看他说了什么,还得听他说话的“感觉”。 这些看似天马行空的技术,对于外呼电话能否打动听众、品牌能否真正有效触达消费者,有着生死攸关的商业价值。 语音识别是个感知特别强的技术,识别对了没什么人夸你,识别错了,用户第一时间就知道。因为用户对人讲话太熟悉了。最常用的技术应用,也是最难做的。我现在做的,就是让错的地方越来越少,让听不懂的情况越来越少。让用户在无感知的情况下,就能享受到技术的价值。 这种风格背后,其实也离不开对人才的持续投入。三位同学都提到,自己在入职初期能快速上手,很大程度得益于导师和前辈的“带一把”。 不仅有专门的技术导师带着解决具体问题,也有不少学长学姐、业务负责人愿意一起拆需求、跑现场、推项目。就像长林说的那样,“你不是被扔进来自己摸索,而是真的有人和你并肩一起走。” 今年5月,京东正式推出了TGT计划(Tech Genius Team,顶尖青年技术天才计划),面向全球招募毕业两年内的硕博技术人才,同时也向有算法竞赛或顶会论文等硬实力的优秀本科生开放。 比如,薪资不设上限,真正以能力和潜力定薪;又比如,配套设立了“三导师制”,技术导师指导科研突破,业务导师帮你打通落地路径,成长导师陪你梳理职业规划;还有专属的场景资源与算力支持,你做的每个算法实验、每次模型迭代,都有真实数据支撑、真实问题反馈。 在技术练兵这件事上,京东天然有巨大的场景优势。海量电商数据、物流网络、金融风控场景……这些构成了一个庞大、完整、真实的技术应用生态。 你可以在这里调系统、跑实验、出论文,也可以直接上线服务千万用户——从0到1的基础研究、从1到100的规模部署,整个链路你都能看见。 就像星衍对我们说的:“在京东,不是等你研究好了再找应用场景,而是边研究、边落地,心向星辰大海,也踏实走好脚下的每一步。” 此次我们接触的三位同学分属不同业务线,参加工作后每天经历的挑战也各不相同,但他们都在话语间透露出这样一个信息: 说起来,京东这三位同学都是屏幕前你我的同龄人,要说有什么不同,就是他们一路上坚定地选了那个自己更想尝试的方向。


