职业经历
工作经历
2021年08月 — 3000年01月
技术,人工智能,机器学习工程师
我参加了“弹幕文本细粒度情感分析”科研项目,该项目利用多种传统机器学习模型及LSTM分类预测模型,实现对弹幕文本情感的分类预测。在该项目中我负责弹幕数据爬取、处理、数据库录入查询、可视化展示以及分类预测模型的优化研究与改进工作。
教育经历
大数据管理与应用
2023年09月 — 2026年07月
项目经历
2022年06月 — 2022年08月
分为三个视角来解读奥运会数据 1. 首先是奥组委视角 通过绘制时间折线图,可以发现无论是夏奥会还是冬奥会,赛事规模(参与运动员数量、国家数量、比赛项目数量)整体上都逐年扩大 通过绘制树状图,可以发现热度最高的项目是田径、游泳、赛艇、足球等 2. 然后是运动员角度 绘制获得金牌数量top气泡图,可以看出美国游泳名将菲利普斯获得28枚金牌独占鳌头; 通过绘制奖牌年龄面积图可以发现,23岁是运动员的黄金年龄,取得奖牌的可能性最大 通过性别对比柱状图,可以看出女性运动员数量在逐年提高 项目间的平均身高与体重大致成线性关系 3. 然后是国家层面 由于原始数据是以运动员为视角,因此通过Tableau的组合,交叉表功能衍生出来其他信息表 中国在近五届夏季奥运会奖牌数都位列前三,在2008年北京奥运会更是取得金牌榜第一名 美国和俄罗斯同样也是体育强国 通过帕累托图可以看出奥运会同样存在二八定律,甚至更为明显,20%的国家拿到了近90%的奖牌 有五个项目都存在超过85%的垄断性夺冠率,分别是 (1) 加拿大在冰球领域的夺金率达到87.5% (2) 美国在篮球领域夺冠率达到90% (3) 中国在乒乓球领域夺冠率达到95% (4) 俄罗斯在花样游泳和艺术体操上夺冠率更是达到了惊人的百分百 在奖牌分布中,不同的国家普遍都是金牌数量最多 对于中国来说,优势项目是跳水、体操、举重、乒乓球、射击等 对于美国来说,优势项目是田径、游泳等
2022年05月 — 2022年07月
情感分析是自然语言处理的研究方向之一,在网络评论分析、舆情分析、问答系统和对话系统中都占据了重要地位。尤其在当今时代中,网络评论成为现代网民表达意见、感受观点的主要载体,在各种社交传播媒体中也占有着非常重要的比重。那么,使用何种算法和计算方式能更准确、更快速的识别情感倾向成了自然语言处理领域的研究热点。本文利用传统机器学习与LSTM长短期记忆深度学习模型,针对近12万条微博评论进行有监督情感分类学习。实验结果表明,LSTM算法在微博短句评论情感分类任务上的准确率与传统机器学习方法相比均有提高。
TA 的技能服务
该人才共 1 项技能服务,可在 技能服务 中搜索「mzjj」查看。