深度之眼NLP大厂实训班笔记

自然语言处理技术近几年发展非常快,像BERT、GPT-3、图神经网络、知识图谱等技术被大量应用于项目实践中。已学完,有需要看文章最后

今年大厂的NLP面试中对项目方面的考察深度也随之提升了很多,经常会被面试官揪着细节一步一步让你解释:“为什么这么做?效果如何?你如何调整模型,你思考的逻辑是什么?”
“说说自己在项目中具体负责的模块中用到的技术细节,遇到了什么问题?你使用的模型的损失函数、如何优化、怎么训练模型的、用的什么数据集?优化算法的选择做过哪些?为啥这么做?”

深度之眼NLP大厂实训班笔记

我们罗列了一些常见的大厂NLP项目深度考察问题:

  • BERT模型太大了,而且效果发现不那么好比如next sentence prediction, 怎么办?
  • 文本生成评估指标,BLUE的缺点
  • loss设计 triplet loss和交叉熵loss各自的优缺点,怎么选择
  • attention机制
  • ernie模型
  • 介绍一下flat及对于嵌套式语料的融合方式
  • 为什么使用lightGBM,比起xgboost的优点是什么
  • 样本不均衡问题的解决办法有哪些?具体项目中怎么做的?
  • 长文本的处理
  • 引入词向量的相似性对于结果有什么不好的影响
  • 如何引入知识图谱
  • 词向量中很稀疏和出现未登录词,如何处理
  • kmeans的k怎么选择
  • 新词发现怎么做
  • 模型选取、数据增强
  • 从数据标注的制定标准,到选取模型,再到改进模型、错误分析
  • NER数据中没有实体标注的句子过多解决方式
  • 同一句话两个一样字符串如何消岐
  • 模型好坏的评估,如何衡量模型的性能\
  • 方面级情感分析的模型结构
  • 模型学习中,正负样本的训练方式不同有什么影响
  • 减轻特征工程的手段

你如果是一位面试候选人,上述问题你会“倒”在哪一关?

“实践出真知”, 只有动手实践具体的项目,以解决问题为导向,在项目中理解技术本身,才能得到更深层次的理解。

你也许会在网络中找到很多资源和论文、但我们面临的问题并不是缺资源,而是找准资源并高效学习。很多时候你会发现,花费大量的时间在零零散散的内容上,但最后发现效率极低,浪费了很多宝贵的时间。而这下面这个刚好解决了这个问题,非常值得学习

深度之眼NLP大厂实训班笔记

目录

01 nlp4-项目1.中文分词

02 nlp4 工程部署

03 nlp4-项目2.关键词提取

04 nlp4-项目3.实体识别

05 nlp4-项目4.文本分类

06 nlp4-项目5文本摘要

07 nlp4-项目6对话系统

课件资料齐全

单课

有需要点我的头像,再私信回复【学习】

发表评论
留言与评论(共有 0 条评论) “”
   
验证码:

相关文章

推荐文章