【NLP】因果卷积(causal)与扩展卷积(dilated)_扩张因果卷积_阿木鸣的博客-程序员秘密

技术标签: NLP  

因果卷积:

因为要处理序列问题(即要考虑时间问题,)就不能使用普通的CNN卷积,必须使用新的CNN模型,这个就是因果卷积的作用,看下面一个公式,对与序列问题(sequence modeling),主要抽象为,根据x1......xt和y1.....yt-1去预测yt,使得yt接近于实际值。

我们根据图片来看下因果卷积的样子,下面这个图片来自:https://deepmind.com/blog/wavenet-generative-model-raw-audio/

上面的图片可以详细的解释因果卷积,但是问题就来,如果我要考虑很久之前的变量x,那么卷积层数就必须增加。卷积层数的增加就带来:梯度消失,训练复杂,拟合效果不好的问题,为了决绝这个问题,出现了扩展卷积(dilated)。

扩展卷积:

对于因果卷积,存在的一个问题是需要很多层或者很大的filter来增加卷积的感受野。本文中,我们通过大小排列来的扩大卷积来增加感受野。扩大卷积(dilated convolution)是通过跳过部分输入来使filter可以应用于大于filter本身长度的区域。等同于通过增加零来从原始filter中生成更大的filter。

这就可以解决因果卷积带来的问题,在示意图中,卷积感受野扩大了1,2,4,8倍。扩大卷积(dilated convolution)可以使模型在层数不大的情况下有非常大的感受野。

 

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/My123456abc/article/details/100875742

智能推荐

java中Class对象详解、类名.class, class.forName(), getClass()区别_路易斯睿齐的博客-程序员秘密

Java反射学习所谓反射,可以理解为在运行时期获取对象类型信息的操作。传统的编程方法要求程序员在编译阶段决定使用的类型,但是在反射的帮助下,编程人员可以动态获取这些信息,从而编写更加具有可移植性的代码。严格地说,反射并非编程语言的特性,因为在任何一种语言都可以实现反射机制,但是如果编程语言本身支持反射,那么反射的实现就会方便很多。1,获得类型类我们知道在Java中一切都是对象,我们一般所使用的对象都

Python读取excel 日期 时分秒_python 把一列 时分秒_amberom的博客-程序员秘密

import xlrdimport datetimefile=u"伏特加.xls"#注意读中文文件名稍微处理一下data=xlrd.open_workbook(file)table = data.sheet_by_index(0)#按照索引读Excel文件colContent=table.col_values(1)#读某一列,日期在第二列nrows=table.nrows #行数print nrowsncols = table.ncols#列数print "有%s列"%ncols #只.

Result Maps collection does not contain value for java.util.HashMap_tornado430的博客-程序员秘密

Result Maps collection does not contain value for java.util.HashMap出现上述错误 主要是因为select标签内部的resultMap、resultType属性指向的不正确注意:在mybatis .xml文件中只要有任何一个resultMap或resultType属性指向错误,则在这个文件中其余正确的语句也不能执行,con...

uni-app 安卓打包流程; 未获取AppKey或配置错误_dcloud_appkey__套码的汉子的博客-程序员秘密

打包后安装应用提示: 未获取AppKey或配置错误;移步最下边第7节uni-app 安卓打包流程(预备环节):1. 安装 SDK 和 android studio2. 申请证书获取Appkey3. (第一步和第二步按照uni-app官方文档都可以顺利完成)官方文档 https://nativesupport.dcloud.net.cn/AppDocs/usesdk/android?id=versionCode建议下载官方的SDK 会包含 HBuilder-Integrate-AS 项目(在 an

ue4 设置intellisence_虚幻引擎4设置Visual Studio_weixin_39683598的博客-程序员秘密

转自:http://www.unrealchina.net/portal.php?mod=view&aid=149设置Visual Studio和虚幻引擎4协同工作有利于提高开发人员使用UE4 的效率和整体用户体验。On this page:推荐设置Intellisense(智能编码)、Live Errors(实时错误)和Squiggles(波浪线提示)实现细节UnrealVS 插件调试针...

如何创建一个简单的二叉树(TreeNode)?_怎样创建treenode_南丘xf的博客-程序员秘密

我们都知道,数据结构最典型的就是数组和链表,在《算法图解》一书中,详细介绍了数组和链表的优缺点:数组查询快(下标),但删除或者插入就比较慢(遍历)链表与之相反,删除和插入元素很快,但查找很慢所以二叉树就应运而生了,它结合二者的优点,取二家之长,但是在实际编程中,大多时候,根本用不到二叉树(实际编程中,我从来没用过二叉树,但是面试可能会问啊,所以趁有空学习总结下),网上找了一下二叉树的应用场...

随便推点

中断和异常的处理_ProgrammingRing的博客-程序员秘密

本文为 第17章笔记中断和异常中断和异常概述中断和异常的作用是指示系统中的某个地方发生一些事件, 需要引起处理器(包括正在执行中的程序和任务)的注意. 当中断和异常发生时, 典型的结果是迫使处理器将控制从当前正在执行的程序或任务转移到另一个历程或任务中去. 该例程叫做中断处理程序, 或者异常处理程序. 如果是一个任务, 则发生任务切换.1. 中断(Interrupt)

Linux 生产者消费者问题代码实现_linux生产者消费者源程序代码_猪猪爱芮芮的博客-程序员秘密

进程间通信(Linux):使用多线程和信号量解决生产者/消费者问题:有一个长度为N的缓冲池被生产者和消费者共同使用。只要缓冲池未满,生产者就可以将消息送入缓冲池中;只要缓冲池不空,消费者便可从缓冲池中取走一个消息。生产者向缓冲池放入消息的同时,消费者不能操作缓冲池,反之亦然。设计要求:(1) 说明设置哪些信号量?信号量的含义和初始值是什么?并用信号量和P、V操作写出进程的同步与互斥算法。(注:...

面试问答汇总_靠谱的内推君的博客-程序员秘密

面试问答汇总目 录一、你最大的优点是什么?(回答技巧及范例)二、 “你有什么问题要问我的吗?” 向面试官提问三、自我介绍四、你为什么会选择你目前学习的专业呢?五、你有过和别人合作的经历吗?六、说说您的缺点,好吗?七、在人际沟通上是否曾经有过不和谐?八、能说一说你未来的职业生涯规划吗?九、在被问到家庭情况的时候,应该怎么回答?十、多个问题同时出现时,应该如何解决十一、关于面试礼仪十二、小组面试十三、回答“你的最大缺点是什么”技巧及范例十四、面试.

mongodb导出数据_error validating settings: invalid collection name_benben_2015的博客-程序员秘密

mongoDB通过mongoexport程序将mongodb实例中的数据存储在json或csv文件中导出。例如:mongoexport --host mongodb1.example.net --port 37017 --username user --password "pass" --collection contacts --db marketing --out mdb-example.j...

进阶的阿牛哥之用python向多人发送邮件(带附件)、遍历邮件获取内容(两种方法:imbox、imaplib)_python发送邮件给多人_进阶的阿牛哥的博客-程序员秘密

一、使用的库这个程序涉及两个库:smtplib 和 email这两个库都是Python自带的,所以不需要额外的下载安装。二、思路和步骤总体思路很简单,就像我们平常上网是通过HTTP协议一样,我们发送邮件是通过SMTP(Simple Mail Transfer Protocol,简单邮件传输协议)来传输的,而现在我们需要做的就是:(1)开启邮箱 SMTP 服务:以 QQ 邮箱为例,开启 SMTP 的路径是:邮箱首页 → 设置 → 账户 → POP3/IMAP/SMTP/Exchange/CardD

推荐文章

热门文章

相关标签