Nocater's Blog

cats:0


  • 首页

  • 归档

  • 分类

  • 标签

  • 关于

  • 搜索

Attention模型详解

发表于 2019-01-13 | 更新于 2019-07-10 | 分类于 NLP | 阅读次数:
Attention机制及相关模型介绍
阅读全文 »

word2vec详解

发表于 2018-12-29 | 更新于 2019-07-10 | 分类于 NLP | 阅读次数:
word2vec两篇论文及Skip-gram详解
阅读全文 »

论文:Globally Normalized Transition-Based Neural Networks

发表于 2018-11-15 | 更新于 2019-07-10 | 分类于 CS224n | 阅读次数:
SyntaxNet模型
阅读全文 »

论文:A Fast and Accurate Dependency Parserusing Neural Networks

发表于 2018-11-13 | 更新于 2019-07-10 | 分类于 CS224n | 阅读次数:
基于神经网络的依赖解析器
阅读全文 »

论文:Incrementality in Deterministic Dependency Parsing

发表于 2018-11-08 | 更新于 2019-07-10 | 分类于 CS224n | 阅读次数:
增量式确定性依赖解析算法:Arc-eager
阅读全文 »

TODO

发表于 2018-11-06 | 更新于 2019-07-10 | 阅读次数:

[x] Google收录
[x] NexT 6.0 公式解析问题
[] - Latex公式说明

NLP数据集备份

Yelp评论:Yelp,就是美国的“大众点评”,这是他们发布的一个开放数据集,包含超过500万条评论。

Blogger Corpus:收集了来自http://blogger.com的681,288篇博文,每篇博文至少包含200个常用英语单词。

20 Newsgroups
从20个网络新闻组中收集的20000条文本数据,可用于文本分析、分类等。
文件大小:61.6 M。ps:数据有点少不到2W。

Billion Words:大型,有统一目标的语言建模数据集。常被用来训练诸如word2vec或Gove的词嵌入表征。

Stanford Sentiment Treebank:标准的情感数据集,在每个句子解析树的结点上带有细腻的情感注解。

亚马逊评论:包含18年来亚马逊上的大约3500万条评论,数据包括产品和用户信息,评级和文本审核。

Netflix PrizeNetflix 发布了他们的电影评级数据集的匿名版;包含 480,000 名用户对 17,770 部电影的 1 亿个评分。首个主要的 Kaggle 风格数据挑战。随着隐私问题的出现,只能提供非正式版。

SogouCS 来自搜狐新闻2012年6月—7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据,提供URL和正文信息。相关教程(搜索关键字:SogouCS 分类):

  • 基于 Tensorflow 的 TextCNN 在搜狗新闻数据的文本分类实践
  • 搜狗新闻语料文本分类实践_CSDN

Text Classification Datasets:一个文本分类数据集,包含8个可用于文本分类的子数据集,样本大小从120K到3.6M,问题范围从2级到14级,数据来源于 DBPedia、Amazon、Yelp、Yahoo!、Sogou 和

THUCNews中文文本数据集: 1.56GB 2016-01-25 数据集下载

腾讯词向量:Tencent AI Lab Embedding Corpus for Chinese Words and Phrases

Springboot使用说明

发表于 2018-10-25 | 更新于 2019-07-10 | 分类于 other | 阅读次数:
Springboot 技术简单使用说明
阅读全文 »

git常用命令

发表于 2018-10-25 | 更新于 2019-07-10 | 分类于 other | 阅读次数:
速查
阅读全文 »

05-序列模型

发表于 2018-10-25 | 更新于 2019-07-10 | 分类于 深度学习[吴恩达] | 阅读次数:
吴恩达深度学习课程第五课笔记
阅读全文 »

04-卷积神经网络

发表于 2018-10-25 | 更新于 2019-07-10 | 分类于 深度学习[吴恩达] | 阅读次数:
吴恩达深度学习课程第四课笔记
阅读全文 »
123
Chen Shuai

Chen Shuai

23 日志
8 分类
25 标签
GitHub
© 2019 Chen Shuai
由 Hexo 强力驱动 v3.8.0
|
主题 – NexT.Muse v6.5.0