商业落地成AI企业集体发力点 追一科技发布业内首个大规模中文

发布时间:2019-11-22 07:54:40      浏览:1150

(艾未未追逐首席技术官刘云峰)

华夏时报(chinatimes.net.cn)记者卢晓在北京报道

“当我们做商务服务时,我们发现客户的一面经常有钉子,但我们不知道要敲什么锤子。我们人工智能公司拿着锤子,但我们不知道在哪里能找到钉子。”10月12日,在“首届中国nl2sql挑战赛”期间,艾风投公司大通一科技的首席技术官刘云峰在接受《华夏时报》等媒体记者采访时表示。据《华夏时报》记者报道,nl2sql(自然语言到sql)是自然语言处理(nlp)的一个分支,专注于数据库的交互创新。

商业登陆已经成为ai公司的共同焦点。刘云峰认为,通过比赛,人工智能的“钉子”和“锤子”可以很好地匹配,找到这项技术的着陆场景。

发布中文数据集

在此次比赛中,大通一科发布了nl2sql的首个大规模中文数据集,包括4,870个表数据、近50,000个标记数据和相应的sql语句。公开数据显示,维基百科(wikisql)和蜘蛛数据集已经由salesforce、耶鲁大学(Yale University)等在国外发布,但国内市场仍处于起步阶段。

刘云峰认为,公共数据集的出现将极大地推动nl2sql行业的技术发展。“因为数据集相当于一把打开的尺子,所以每个人都愿意用这把尺子来衡量他们最好的方法,并且不会在得出不可靠的结论后再这样做。”据记者报道,李菲菲曾是谷歌首席人工智能科学家,此前曾在计算机视觉领域制作imagenet数据集,这被认为对人工智能行业有重大影响。

刘云峰告诉《华夏时报》等媒体记者,在今年年初的比赛之前,只有微软和大通一科技在学习中文nl2sql。然而,这场比赛吸引了1400多支队伍,这个方向已经开始被注意到。此外,据记者了解,各队在比赛开始时的准确率仍超过60%,选手的最高得分在重播结束时达到92%。

业内有人认为nl2sql在银行、保险、证券、电子商务等数据挖掘领域有很大的应用潜力,可以大大降低数据库的访问和使用门槛。“许多企业以数据库的形式存储原始数据和知识。与知识地图相比,数据库将被更频繁地使用。”刘云峰也告诉记者。

据记者了解,chase one technology发布的数据集涵盖金融、新零售和房地产等十多个领域,其中约一半是金融业。不过,他也强调,数据集上相对较好的结果表明,它具有一定的泛化能力,“但最终登陆将不得不根据其垂直行业进一步优化。”

公共数据显示,专注于自然语言处理的大通一号科技(Chase One Technology)成立于2016年,已经经历了四轮融资,总额超过7000万美元。最新的融资记录是在今年4月,当时大通一号科技(Chase One Technology)宣布已经完成了4100万美元的C轮融资。

刘云峰还表示,大通一科技目前拥有超过400人的规模,并在南京、上海和新加坡拥有自己的研发团队。其中,新加坡团队专门研究nlp的国际布局。他透露,今年国际技术的主要焦点是打样,先开拓东南亚市场,然后开拓欧洲市场。

Nlp技术年

数据集的更大作用被认为促进了人工智能技术的产业化。事实上,商业登陆已经成为人工智能产业面临的一个共同问题。

与消费市场相比,to b已经成为人工智能更大的市场。刘云峰告诉《华夏时报》等媒体记者,如果消费市场遇到一些爆炸性的点,将会有指数级的增长。然而,消费者市场的红利已经消失,包括阿里和腾讯,它们正转向行业互联网。

"未来的首席人工智能公司必须是全堆栈人工智能公司."刘云峰说。他告诉记者,当涉及工业着陆时,人工智能技术经常同时处理多个信号。视觉和自然语言处理等领域越来越多,多模态集成已经成为一种趋势。

根据公共数据,计算机视觉也涉及智能语音和自然语言处理相关领域。专注于智能语音的HKUST迅飞也在做与计算机视觉相关的工作。记者了解到,大通一科技也有自己的视觉和声音团队。它现在正在做的交互式数字人类包括三种实时人工智能技术:语音、自然语言理解和视觉。

事实上,在上述三个人工智能领域中,计算机视觉领域发展最快。不仅人工智能行业的领先公司主要来自计算机视觉赛马场,而且人工智能公司对计算机视觉赛马场的估价普遍高于其他领域。

刘云峰认为,计算机视觉赛道发展最快是因为它最早的成熟。“特别是开放数据集的出现极大地促进了视觉技术的成熟,能够满足我们行业的需求,因此其推广速度相对较快。”他说,从学校的举动可以看出,视觉人才的数量是最大的,这个领域的实验室数量也是最大的。Nlp和voice供应不足,其中许多已经从视野中转换过来。“目前,没有人能在这个方向上成为绝对的霸主。人工智能的技术迭代速度非常快,后来者有很多机会达到技术高峰。”

刘云峰告诉记者,nlp经常与含糊不清作斗争。在过去的两年里,已经建立了许多基本的自然语言技能来相对较好地解决这个问题。在这个基础上,我们可以做越来越复杂的任务。“从技术成熟的角度来看,今年绝对是nlp的新年。产品到达之前应该有一两年的延迟,之后会有一场大爆炸。”

责任编辑:黄李猩编辑:韩枫

11选5下注 天津11选5 加拿大28app