百事通!36氪首发|恺望数据获得千万级天使轮融资,打造自动驾驶数据自动化平台
发布时间:2022-09-06 15:40:28 文章来源:李安琪
恺望数据希望成为车企/自动驾驶公与数据标注服务团队、标注执行人员多方之间的平台型桥梁。

作者 | 李安琪


(资料图片仅供参考)

编辑 | 苏建勋

36氪获悉,近日「恺望数据」获得了千万元级天使轮融资,本轮融资由辰韬资本、三一集团和溪山天使汇投资。据悉,本轮融资主要用于团队建设与技术研发,搭建规模化自动驾驶数据服务平台。

恺望数据成立于2022年2月,是一家为车企与自动驾驶公司提供一站式数据解决方案的公司。针对数据供给不稳定、流程繁杂、工具低效等痛点,恺望致力于让数据生产线从手工作坊向标准化、规模化和自动化转变,提升自动驾驶数据生产效率,保持产能稳定并降低成本,加速自动驾驶落地。

恺望数据创始人于旭硕士毕业于法国昂热大学,是字节跳动、Momenta、Uber等企业数据生产及运营体系的第一搭建者,拥有多段从零到一的大数据平台搭建经验。团队成员来自字节跳动、阿里巴巴、Uber、Momenta、梅赛德斯-奔驰等公司。

近年来,随着汽车智能化、智能驾驶的发展,汽车的传感器种类与数量越来越多,包括摄像头、毫米波雷达、激光雷达等;同时传感器硬件结构、参数变化增多、车辆驾驶的场景复杂度增加、软件OTA速度加快等,这些都对数据的质量、时效性要求越来越高。

以标注数据为例,数据标注本质上是通过2D图像视频和3D激光点云中的物体标注,教会自动驾驶系统识别道路环境和交通参与者。过往,自动驾驶感知算法大多只覆盖了十几类数据,但当下数据标注类型激增到了五十多类,就连特斯拉此前也建立了上千人的数据标注团队。

恺望数据创始人兼CEO于旭告诉36氪,今年自动驾驶数据的处理需求量处于暴增状态,但当下行业的数据标注处理基本还属于一个密集型劳动作业,大多生产流程都是包工头式的项目分包模式,存在着诸多痛点。

最为典型的就是,数据标注服务团队缺少自动驾驶技术背景,很难理解算法背后的数据需求规则。于旭举了一个例子,某车企对自动驾驶数据的标注规则长达200页,但数据服务公司很难在短时间内完全消化这么多内容。往往是一知半解地标注,然后让车企指出哪里不对,才能正确理解标注的规则。一来一回间,大大提升了数据的处理周期。

关键在于,这种需求规则并非一成不变。当车企的算法发生变化,标注的规则也会发生相应改变,尤其是在智能驾驶软件快速OTA升级的当下。

当规则需求发生变化,且出现数据处理需求波峰时,小型的数据服务团队在筛选及沟通环节更是无法应对。以某智驾研发公司为例,其算法团队有近百人,但对应的数据服务团队仅2人,当算法设计出现较大变化时,根本无法及时应对激增的数据需求,只能在一天时间内拼凑出一份模糊不清的需求说明书。

行业的痛点,成了恺望选择的切入点。以上述车企的需求为例,于旭告诉36氪,得益于团队的自动驾驶技术理解与运营管理背景,两周内就消化了车企200页的内容,并将文档浓缩成5页精华,大大减少了数据标注执行层的理解负担。

图源:恺望数据

据于旭介绍,恺望数据主要做了两件事:一是集结低成本人力和预标注技术的数据服务平台,以半人工、半自助的模式规模化生产数据;另一方面,则是提供一站式的数据闭环服务解决方案,在追求全自动的过程中提供全链条服务,更好地满足终端客户的数据闭环应用需求。

简而言之,成为车企/自动驾驶公司与数据标注服务团队、标注执行人员多方之间的平台型桥梁。

针对这个平台,恺望从供给资源、生产流程、生产工具三个数据生产核心要素总结了三个特点:

第一,打造一个多方共用的海量数据标注平台,构建低门槛参与的生态体系,形成规模又灵活的产能,满足弹性较大的人力需求;对于传统标注公司而言,试错成本变低;对于车企/自动驾驶公司而言,也能够有充足人力资源来对抗数据的波峰波谷。

但随之而来的一个问题是,每个企业的自动驾驶标注规则、语言不尽相同,恺望如何满足不同客户的需求?因此恺望平台的第二个特点是,将平台功能进行原子化拆解,灵活的功能模块可以满足不同用户的需求,以缩短项目周期。

于旭表示,虽然每家的算法和阶段会有不同,但是数据这一层是有较大的通用性的,因为要标注的核心元素都一样的,只是标注方法有所区别,而恺望会把某个元素进行原子化拆解。比如标注一辆车,恺望可以分解成车本体、朝向、定位等多种信息。通过尽可能细分属性,这样面对车企的每一个选择都能提供标准参考。

第三则是借助以数据驱动的自动化标注技术,致力于将平台打磨成真正的自动化工具,提升数据生产的效率。

恺望表示,在平台的自动分化机制下,平台可以合理将任务分给最合适的供应商、实现标注链最短路径、系统可自动判断需求合理性、成本及ROI等,进而将标注成本降低到1/10,算法预标注成本优化为原来的30%-80%。预计今年10月,恺望会推出这个数据标注SaaS平台。

目前,恺望已与战略投资方三一集团在自动驾驶领域开展数据合作,其他客户包括集度汽车、字节跳动、亿咖通、元戎启行、地平线、寒武纪、中交兴路、旷视及商汤等。

关键词: 数据服务 生产流程 三一集团

热点HOT

  • 亦庄路口车均延误率是多少 未来自动驾驶的有哪些难关需要克服?
    亦庄路口车均延误率是多少 未来

    亦庄路口车均延误率是多少?亦庄提供的数据显示,目前示范区已有13个相对独立的路口实现单点自适应,路口车均延误下降28 48%,27条主要干线

  • 舞龙舞狮为什么能培养团队精神 五禽操是谁发明的?
    舞龙舞狮为什么能培养团队精神

    舞龙舞狮为什么能培养团队精神?舞龙舞狮,是具有广泛群众基础的习俗,也是将音乐、舞蹈、竞技、娱乐结合在一起的文化娱乐活动。很多地方都

  • 我国防汛工作的关键期是什么时候 什么是韧性城市?
    我国防汛工作的关键期是什么时候

    我国防汛工作的关键期是什么时候?7月下旬至8月上旬一直是我国防汛工作的关键期。今年入汛时间较早,预计南方地区前期汛情较重,水毁工程多

  • 云南省在建和在用各类数据中心有多少个 云南省高新技术企业有多少家?
    云南省在建和在用各类数据中心有

    云南省在建和在用各类数据中心有多少个?目前,全省在建和在用各类数据中心达到42个,建成了1 75万核的高通量计算平台,构建了南亚东南亚语

  • 夜宵到底要不要吃 夜食的危害有哪些?
    夜宵到底要不要吃 夜食的危害有

    夜宵到底要不要吃?这就要看你是否吃够一天的营养,是否饥饿感会影响到睡眠。如果三餐食物摄入量足够了,晚上睡前也不感到饿,只是见别人在

  • 我国草种对外依存度是多少 我国商品草种年需求量是多少?
    我国草种对外依存度是多少 我国

    我国草种对外依存度是多少?作为草原生态修复和现代草牧业发展的重要物质基础,我国草种对外依存度高达70%以上。唐芳林说:特别是草原生态修

  • ​人工影响天气是什么原理 人工降雨究竟是怎么实现的?
    ​人工影响天气是什么原理 人工

    ​人工影响天气是什么原理?人工影响天气,是指为避免或者减轻气象灾害,运用云和降水物理学原理,主要采用向云中撒播催化剂的方法,使某些

  • 我国知识密集型服务进出口年均增速是多少 中国服务业增加值增长率是多少?
    我国知识密集型服务进出口年均增

    我国知识密集型服务进出口年均增速是多少?2012年至2021年的10年间,我国知识密集型服务进出口年均增速达到9 3%,占比提高了10 3%,其中个人

  • 广州市人工智能产业链总链主单位是谁 广州营收过亿元的高新技术企业有多少家?
    广州市人工智能产业链总链主单位

    广州市人工智能产业链总链主单位是谁?广州无线电集团有限公司是广州市人工智能产业链总链主单位。我们将加快广州人工智能公共算力中心建设

  • 中外合作办学是从什么时候开始的 中外合作办发展情况如何?
    中外合作办学是从什么时候开始的

    中外合作办学是从什么时候开始的?如今,中外合作办学事业已走过30余年的发展历程。1986年,在改革开放的大背景下,我国颁布了第一个有关中

新闻LOVE