当前位置 > 首页 > 数据委动态 > 7.24 CPDA数据分析师沙龙回顾 | 疫情下大数据应用与未来发展趋势

7.24 CPDA数据分析师沙龙回顾 | 疫情下大数据应用与未来发展趋势

来源:中国数据分析行业网 | 时间:2020-07-28 | 作者:数据委

 

7月24日,我们为全国CPDA数据分析师带来了一场精彩的主题为《如何用Python文本挖掘解析疫情数据》的线上沙龙活动。

 

本次活动特邀高松老师为广大CPDA数据分析师们进行专业分享。本期活动的最大亮点是基于真实数据信息,为大家详细展示Python编程方式是如何对大文本数据实现高效分析与挖掘。同时,为大家分享了老师在教学工作中的宝藏经验。活动吸引了数百位各行业、各领域的CPDA数据分析师。

 

在一个多小时活动中,小伙伴们积极参与,气氛活跃。高松老师将其多年的从业经验倾囊相授,并在线上与学员们进行互动交流。通过真实的数据化工作场景,让想了解数据分析业务基础及分析思路的同学们,体验了一场“真实”的实战盛宴,现在就让我们一起来回顾吧!

 

回顾一:自然语言处理技术阐述

 

 

 

活动开始,高松老师通过一些典型文本案例,对文本挖掘的底层技术进行分步介绍,包括基础的原理介绍、深层次理解分析、基础应用、高应用以及便捷算法等。

 

回顾二:Python编程方式处理大文本数据展示

 

 

 

 

紧接着,高松老师为我们循序渐进的讲解在处理文公挖掘工作中的基本流程,文本挖掘与数据挖掘工作的不同之处,数据爬虫编码的推导过程,以及作实际过程中的一些需要规避的雷区等。

 

基于对自然语言处理技术的认知,高松老师带领大家执行一个千位级别的关于新冠疫情新闻文本处理的完整工作过程。通过学习这一案例指引大家更大批量的文本信息工作,向大家分享了十多个文本预处理工具及优势、Jieba工具的精巧使用、Pyecharts数据可视化应用、基于TF-IDF计算每个词语的权重值、文本主题分析和工具使用等。

 

老师表示,Python编程方式运用得当,将会大大缩短我们日处理文本的工作量,以较高的工作效率获得更有价值的指导性意见。

 

回顾三:文本挖掘之私囊倾受

 

 

 

最后,高松老师为大家分享了其在数据分析工作中的多年经验积累,讲解了文本挖掘在预处理阶段的付出与注意事项、人工干预对文本挖掘过程的影响、未来文本挖掘的重点方向,文本挖掘的学习讲义等等。

 

在本期沙龙活动的答疑环节里,高松老师就大家关心的个性化问题进行了现场答疑,小伙伴们纷纷表示本次沙龙活动不仅有丰富的理论干货,还有关于个人教学工作上的资源分享,让CPDA数据分析师们受益匪浅!