大同区| 伽师| 中方| 兴文| 耒阳| 玉屏| 行唐| 英山| 大荔| 门头沟| 方正| 开鲁| 曲麻莱| 巴彦| 坊子| 凤冈| 东港| 鹤峰| 富平| 澄江| 镇平| 谢家集| 裕民| 申扎| 金山屯| 灵石| 沈丘| 相城| 静宁| 郾城| 绵阳| 安溪| 旅顺口| 香格里拉| 浦城| 永吉| 桦甸| 梅里斯| 汉阴| 零陵| 射阳| 渭南| 阳西| 紫云| 安丘| 迭部| 得荣| 大方| 蚌埠| 拜城| 渝北| 新平| 上海| 冷水江| 沁源| 霍山| 鲅鱼圈| 虞城| 平江| 鄂州| 吴中| 鸡西| 乌恰| 河池| 绍兴县| 且末| 维西| 察哈尔右翼后旗| 独山| 蒲江| 渭南| 白城| 佛坪| 贵阳| 乐都| 灵山| 龙胜| 灵山| 冷水江| 曲江| 闽侯| 江西| 珲春| 崇信| 阳西| 绥阳| 利川| 城步| 台南市| 全南| 肥西| 陕县| 峰峰矿| 左贡| 托克逊| 金堂| 什邡| 安国| 江永| 曲阳| 云龙| 东兴| 垦利| 宁强| 社旗| 新城子| 大冶| 灯塔| 甘谷| 丹徒| 成武| 巴中| 叶县| 新化| 黔西| 贾汪| 安陆| 团风| 纳溪| 东丽| 武乡| 科尔沁右翼前旗| 太康| 海兴| 苍溪| 美姑| 鹰手营子矿区| 五常| 当阳| 礼县| 乌马河| 呼图壁| 同德| 峨眉山| 平和| 双桥| 塘沽| 谢通门| 奉化| 东光| 大庆| 阿荣旗| 高雄县| 晋中| 扶绥| 安仁| 桐柏| 曲江| 梁平| 长白| 潼关| 平泉| 古冶| 乌拉特中旗| 新会| 蓝山| 温江| 肥乡| 上饶市| 红安| 奈曼旗| 巴东| 贵南| 南宁| 天池| 小河| 章丘| 河南| 蓟县| 朗县| 科尔沁右翼中旗| 岚皋| 遂昌| 山阴| 蓬莱| 吉利| 高碑店| 海阳| 峨眉山| 贺兰| 兖州| 南宁| 桦川| 习水| 衡阳市| 余干| 怀仁| 新巴尔虎右旗| 铁力| 阜南| 洛宁| 武山| 代县| 建瓯| 龙胜| 石屏| 无极| 新民| 宣化区| 白银| 泽普| 贞丰| 修文| 台安| 平坝| 金寨| 福泉| 永仁| 荣县| 怀安| 大邑| 孝义| 孟州| 大方| 乌尔禾| 凌海| 中牟| 乐安| 望都| 敦化| 隆德| 通江| 嘉祥| 濮阳| 厦门| 都兰| 津南| 连江| 南江| 深泽| 寿县| 曲水| 蓬莱| 石棉| 平顺| 连平| 会泽| 道县| 新乐| 石台| 康保| 察雅| 乌兰浩特| 汤旺河| 蕲春| 毕节| 南投| 安福| 类乌齐| 博鳌| 开县| 潍坊| 曹县| 桓台| 罗甸| 仁布| 吐鲁番| 大英| 定兴| 昌邑| 阿荣旗| 宾川| 资兴| 安化|

锦程消费金融为何要引入2至3家大数据、消费场景公司

2019-09-22 13:44 来源:商都网

  锦程消费金融为何要引入2至3家大数据、消费场景公司

  飞行途中,这名旅客突然感到身体不适,出现呼吸困难,一度抽搐昏迷,情况十分危急。”于是,胡先生也告知该卡的密码,但并没有将护照复印件交给叶国强。

3月20日报道港媒称,第22届国际被动房大会3月10日在德国慕尼黑落幕。另据《日本经济新闻》8月11日报道,中国下调人民币市场汇价至今已有两年,以此为开端,人民币贬值和资本流出势头加速,政府被迫实施货币保卫战。

    对华产品设限将损害美国经济竞争力  自从美国计划对从中国进口的商品大规模征收关税消息传出以来,美国学界、企业界及各社会组织连日来明确发出警告,称有关举动不但无助于解决美中经贸问题,反而将直接损害美国自身利益。”麦金太尔说,团队希望不久后能把ASC冷冻程序实施到临终前的绝症病人身上,以保存到更完整的大脑。

    “3D藏宝图”并非一张实际的地图,而是利用多种探测手段对考古区域的扫描成像。  丽水市中级人民法院于2016年11月25日,以诈骗罪判处叶国强有期徒刑15年,同时责令叶国强退赔胡先生1900万余元。

生态环境部对外保留国家核安全局牌子。

  经贸关系是中美关系的压舱石,对全球都有重大影响。

  报道认为,随着数据分析、人工智能等变得可供人们使用,云也将为企业(尤其是中小企业)带来变革。所谓奇点,是指在不久的将来科技快速发展的时期。

    习近平的两会时间  在这里,总书记和基层书记面对面  一路从基层走来,习近平总书记对基层很了解,也很牵挂。

  报道认为,很快,推动人们对网络带宽和存储容量提出更高要求的主因将不再是用户制作的猫咪视频,而是国际数据公司白皮书《数据时代2025》中所说的用于非娱乐目的的图像和视频内容。据法新社布鲁塞尔3月19日报道,这家隶属农产品企业Veviba的屠宰场存在大规模的牛肉标签造假行为,尤其涉及伪造冷冻日期以显示产品新鲜。

  实验结果显示,青少年自行车选手骨骼内的矿物质水平低于同龄人的平均水平。

  5年后,每年预算赤字就将超过一万亿美元。

  研究发现如下:约38%的乘客从来不离开座位,38%的人离开一次,13%的乘客离开两次,11%的人离开超过两次。科学家发现,经改造后使其基因没有能力制造TNF-alpha的老鼠,尽管体重增加,但是味蕾并没有减少,表明这种化合物可能就是罪魁祸首。

  

  锦程消费金融为何要引入2至3家大数据、消费场景公司

 
责编:

中共中央宣传部委托新华通讯社主办

半月谈

首 页 >> 资讯 >> 发现基层 >> 北京日报:语音识别距人类只差0. >> 阅读

北京日报:语音识别距人类只差0.4%?

2019-09-22 08:40 作者:姜姝姝 来源:北京日报 编辑:常磊
分享到:

据埃菲社3月20日报道,此项研究将42名年龄在14岁到20岁之间的男性作为调查对象,这些人每周接受10小时以内的自行车运动训练。

日前,美国一家公司宣称专业速记员在记录对话时,转录词错率为5.1%,而该公司最新研发的语音识别系统词错率已达到5.5%,超越之前的历史最佳水平,树立了新的里程碑。语音识别,是人工智能领域的核心问题之一,0.4%的差距似乎意味着机器即将比肩人类。

 
    已过“甲子”之年
 
    斯坦福大学的相关研究者在2016年9月发布了一篇名为《2030年的人工智能与生活》的文章,提到:人工智能领域正式诞生于1956年夏天,一场由约翰·麦卡锡组织的在美国达特茅斯暑期研究项目的研讨会,在多年以后被认定为全球人工智能研究的起点。
 
    其实,对于人工智能子项目之一的语音识别来说,它的历史甚至比60年还要久。
 
    语音识别的研究源头可追溯至1950年,计算机科学之父阿兰·图灵在《思想》(Mind)杂志上发表了题为“计算的机器和智能”的论文,首次提出了机器智能的概念,论文还提出了一种验证机器是否有智能的方法:让人和机器进行交流,如果人无法判断自己交流的对象是人还是机器,就说明这个机器有智能了,这就是后来鼎鼎有名的人工智能图灵测试。
 
    图灵测试的概念极大影响了人工智能对于功能的定义,以此为途径,卡内基梅隆大学的两位科学家希尔伯特·西蒙和曼纽尔·布卢姆做了大量的前期工作,非常精妙地证明了罗素《数学原理》52道中的38道。西蒙甚至宣称在10年之内,机器就可以达到和人类智能一样的高度。
 
    在这一时期,科学家们也将语音识别比作“机器的听觉系统”,该技术可以让机器通过识别和理解,把语音信号转变为相应的文本或命令。1952年,贝尔研究所、Davis等人研制了世界上第一个能识别10个英文数字发音的实验系统。1960年,英国的Denes等人研制了第一个计算机语音识别系统。
 
    从“模拟”人脑到开创统计方法
 
    当20世纪50年代明确了人工智能要模拟人类智慧这一大胆目标后,这一领域经历了近20年的辉煌。研究人员开展了一系列项目,表明计算机能够完成一系列原本只属于人类能力范畴之内的任务,例如证明定理、求解微积分、通过规划来响应命令、履行物理动作,甚至是模拟心理学家心理实验、作曲家谱曲这样的活动。
 
    但是,过分简单的算法以及计算能力的限制,严重阻碍了人们使用人工智能来解决更加困难和多样化的问题。
 
    这一阶段在人工智能的细分领域语音识别上,科学家们也走上了同样的弯路。他们认为,计算机要完成语音识别这类只有人才能做的事情,必须先让计算机理解自然语言,导致研究局限在人类学习语言的方式上了,即电脑模拟人脑,语言学者参与了大量的研究工作,但最后的成果却近乎为零。伴随着对未来继续努力的失望,人工智能包括语音识别都于20世纪70年代中期逐渐淡出公众视野。
 
    转机出现在统计语言学的创立上。这不得不提一个关键性人物——德里克·贾里尼克和他领导的IBM华生实验室,他们创新的使用统计方法,将当时的语音识别率从70%迅速提升到90%,同时语音识别的规模从几百个单词上升到几万个单词,使得语音识别就有了从实验室走向实际应用的可能。
 
    在贾里尼克之前,科学家们都把语音识别问题的核心归结为语言学中的规则问题,而贾里尼克将它当作通信问题后,用两个隐含马尔可夫模型(声学模型和语言模型)把语音识别重新概括清楚了。
 
    这个框架结构至今仍对语音识别影响深远,它不仅从根本上使得语音识别有使用的可能,而且奠定了今天自然语言处理的基础。贾里尼克后来也因此当选美国工程院院士,并被某杂志评为20世纪100名发明家之一。
 
    尽管贾里尼克在1972年就提出了新的研究范式,但模拟人脑与统计学的方法之争,却持续了近十五年时间,语音识别领域历经了十五年的新旧交替后,最大的成果其实是在技术的应用及产品化方面出现了进展。
 
    大进步的催化剂
 
    在互联网大爆发的20世纪90年代,人工智能的相关研究又一次停滞了。直到21世纪前10年,出现了一系列复兴人工智能研究进程的要素,尤其是下面这些重要的因素和核心技术:
 
    大数据。得益于互联网、社交媒体、移动设备和廉价的传感器,这个世界产生的数据量急剧增加。大数据是人工智能发展的助推剂,这是因为有些人工智能技术使用统计模型来进行数据的概率推算,如语音识别,通过数据的海洋中丰富的语料,使得技术不断优化。
 
    新算法。算法是解决一个设计程序或完成任务的路径方法。在一个完整的工业界语音识别系统里,最关键的是深度学习算法,还有很多工作是专业领域相关的算法,以及海量数据收集和工程系统架构的搭建。这些算法本身很重要,同时也是其他技术的推动者,比如机器学习算法Google的TensorFlow目前就被开源使用。
 
    可以说,任何技术都有蓄能阶段和爆发阶段,人工智能包括语音识别技术的爆发都得益于以上条件。这也不难理解,从语音识别来看,它是需要经验、数据和用户反馈共同作用来提升表现的。需要利用用户的反馈总结出一些特点。
 
    谷歌是最早在全球范围内大规模使用深度学习算法的公司,也最早开创了用互联网思维做语音识别。在这方面,科大讯飞受到谷歌的启发,迅速跟进成为国内第一个在商用系统里使用深度学习的公司。
 
    现有成绩和待解难题一样多
 
    语音识别技术已经发展了几十年,因为大数据和深度学习的应用,这一领域的传统强者成了谷歌、亚马逊、苹果和微软这些美国科技巨头,据统计,美国至少有26家公司在开发语音识别技术,而中国则有近50家公司研究这一领域。
 
    尽管谷歌这些巨头在语音识别技术上的技术积累和先发优势让后来者似乎难以望其项背,但因为一些政策和市场方面的原因,当然也有部分原因是中文的复杂程度高于英语,所以国际巨头的语音识别主要偏向于英语,中文领域的语音智能机会则留给了科大讯飞、百度、搜狗等中国公司。在国内,这些本土化产品更为用户所熟知。
 
    中文领域的识别难度在哪里?举个简单的例子,鲁迅《孔乙己》中的孔乙己之问:茴香豆的“茴”有几种写法?或者一个更有时代感的案例,如何形容物流很快?据说,在汉语里回答这个问题竟然至少有3600种说法,比如第二天就到了、物流很给力、给快递点赞等不尽其详。尽管语音识别在近些年来取得了巨大的进步,但其实仍然还有很多的工作要做。
 
    此外,还有确保语音识别能在更为真实生活的环境中良好地工作。这些环境包括具有很多背景噪声的地方,比如聚会场所或在高速路上驾驶的时候;还有在多人交谈环境中将不同的说话人区分开。
 
    还有一个更深层次的难题是,如果需要实现人机对话、人机写作,不只是需要用机器转录来自人类嘴巴的声音信号,更要理解人们所说的话。
 
    从语音识别来看,下一个前沿是从识别走向理解,真正的人工智能仍然还在遥远的地平线上,在机器能理解其所听到或看到的事物的真正含义之前,还需要很长时间的工作,有很长的路要走。
 
    或许也可以说,我们正在从一个人类必须理解计算机的世界,迈向一个计算机必须理解我们的世界。亚里士多德曾说过,如果机器能干很多活,岂不能让人类解放出来,或许这一解放的起点就是“理解”。(姜姝姝 作者为《机器人产业》杂志副总编辑)


版权声明:凡本网注明"来源:半月谈网"的所有作品,均为半月谈网合法拥有版权或有权使用的作品,任何报刊、网站等媒体或个人未经本网书面授权不得转载、 链接、转帖或以其他方式复制发布。违者本网将依法追究法律责任。如需授权,点击 获取授权

哈日毛都嘎查 社会生活 义利食品厂 次渠镇 淮塔北门
南湖春晓 头道兴隆巷 浙江海宁市周王庙镇 东关头 嘉兴路街道