Skip to content
View ningshixian's full-sized avatar
😃
😃

Block or report ningshixian

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
ningshixian/README.md

👨‍💻 Ning Shixian

NLP Developer @ Li Auto | Open Source Enthusiast
📍 Based in Beijing, China 🇨🇳

📚 个人博客📂 GitHub


🛠 技能栈与工具箱 (Languages & Tools)

🤖 核心技术

Python PyTorch HuggingFace LLM

⚙️ 后端与工程

Bash Docker MySQL Redis ElasticSearch Kafka

💼 工作经历 (Work Experience)

🚗 理想汽车 | 高级算法工程师

2023.12 - 至今

负责 2C 端智能客服系统开发及大模型(LLM)前沿应用研究。

🐚 贝壳找房 | NLP 研究员

2023.10 - 2023.12

探索 NL2SQL 领域,负责自然语言转数据库查询语句的研究与对齐。

组内项目的目标不明确,导致工作的时候像个无头苍蝇般迷茫,干的很累和疲惫,每天沟通、对齐,却又每天都没对齐,遂放弃了

🈳[空窗期]

23年 5 月离职后,照顾媳妇生娃,空窗期了半年。

🐲 龙湖集团 | NLP 算法开发

2019.07 - 2023.05

从 0 到 1 搭建内部 2B 端智能客服系统。

  • longfor_slot_extract:开发 longfor 对话助手中的槽位提取模块,针对不同业务场景,实现精确/模糊/嵌套实体抽取。相关介绍在博客介绍
  • domain_keyphrase_extract:领域关键短语抽取,帮助业务挖掘知识中的领域实体词库及其常用说法。具体实验方案的解读在博客
  • chinese-interrogative-recognition:中文疑问句识别,用于 query 理解。相关介绍在博客
  • corpus-generalization-spider:语料泛化爬虫工具,借助搜索爬虫和相似性度量,对标准问扩展相似问,丰富训练数据;
  • metric_learning:这个项目是为了训练 Embedding 模型,包括了度量学习和对比学习的一些实验,主要有双塔、triple loss、AMSoftmax+simcse、rdrop、Bert-whitening等。具体介绍在博客
  • seq2seq_with_bert_unilm:以“BERT+UniLM”为基础架构,训练一个Seq2Seq模型,用于坐席辅助-话术生成。主要借鉴了苏剑林.《Seq2Seq+前缀树:检索任务新范式(以KgCLUE为例) 》 Blog post
  • learning_to_rank:主要是排序学习LTR的一些实验,用于协助企业内搜的精排阶段。相关模型介绍在博客

🥋 兴趣爱好

  • 持续关注 NLP 前沿技术(Transformer, RLHF, Multi-Agent)
  • 热爱开源社区分享与技术博客撰写

Popular repositories Loading

  1. LSTM_Attention LSTM_Attention Public

    attention-based LSTM/Dense implemented by Keras

    Python 300 76

  2. UMLs UMLs Public

    UMLs(一体化医学语言系统)介绍

    44 3

  3. Keras-Tutorial Keras-Tutorial Public

    Keras深度学习框架配置+Keras教程+Keras Trick

    Roff 33 11

  4. NER-CONLL2003 NER-CONLL2003 Public

    Entity recognition of CONLL2003 corpus using Keras

    Python 30 6

  5. AC-BLSTM AC-BLSTM Public

    Asymmetric Convolutional Bidirectional LSTM Networks for Text Classification

    Python 11 5

  6. dut_tianchi_mobile_recommend_train dut_tianchi_mobile_recommend_train Public

    ##阿里移动推荐算法竞赛 ###

    Python 9 7