当前位置:网站首页>【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】
【数据挖掘】用Excel挖掘股权关系并按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现】
2022-04-22 10:33:00 【华为云】
个人简介:简介:大三在读,分享一些学习笔记和心得体会
兴趣领域:Python,人工智能,算法和数据结构
格言:逆水行舟,不进则退!
目的:一起进步!
哈喽!大家好呀我是【南蓬幽】,也可以叫我小幽,小友,小呦等等
如果有不对的地方,欢迎大家指正另外如果觉得不错的话请三连支持一下博主呦
欢迎大佬们呀
前几天朋友让我帮他挖掘一下数据,做好后请我吃好吃的🤩🤩虽然不会但是不能丢面呀!(绝不是为了好吃的)就尝试用Python做了一下。
大概要求:
1、数据库,是给定的原始数据集合;
2、挖掘数据库“关系详情”中的“夫妻/配偶、兄弟姐妹、父子、父女、母子、母女”具体信息;
3、挖掘后的信息整理成【示例】中的格式;
注意:
1)一个证券代码对应多个年份;
2)该证券代码下的公司存在某种类型的关系标记为1,不存在对应关系标记为0。
3)按照年份统计不同类型的亲缘关系在上市公司中的分布和趋势【可视化呈现-自由选择方式】。
数据:

我看了一下大概十几万条!
原本想简单用Python跑了一下,看看效果,但是几分钟也没出结果就放弃了!(原因自己技术不到家)

于是就用Excel表做数据挖掘。
方法:
第一步:提取年份。
新建一个年份列,点击年份下的空格,输入函数
=YEAR(B2)
提取统计截止日期中的年份
下面的十字快速双击就行了,年份这一列就完成了!

第二步,判断持股人之间的关系
在关系列下的空格中输入函数
=IF(OR(ISNUMBER(FIND({“哥”,“弟”,“兄”,“姐”,“妹”},J2))),1,0)
判断关系详情中是否包含哥或第或姐或妹等字符,如果包含就为1,不包含就为0

其他的类似分别输入对应的函数
=IF(OR(ISNUMBER(FIND({“夫妻”,“丈夫”,“妻子”},J2))),1,0)
夫妻
=IF(AND(ISNUMBER(FIND({“父”,“子”},J2))),1,0)
父子
=IF(AND(ISNUMBER(FIND({“父”,“女”},J2))),1,0)
父女
=IF(AND(ISNUMBER(FIND({“母”,“子”},J2))),1,0)
母子
=IF(AND(ISNUMBER(FIND({“母”,“女”},J2))),1,0)
母女
因为数据量大,没有一一看,可能有些类似谁是谁的长子,谁是谁的女婿等未提取出
这样持股人之间的关系就提取出来了。
第三步,制作统计表

同样我们也用函数!
按照年份统计每一年持股人不同的关系的总数
在每一列关系下的第一个空,分别输入以下函数
=SUMIF(C2:C199673,T2,L2:L199673)
=SUMIF(C2:C199673,T2,K2:K199673)
=SUMIF(C2:C199673,T2,M2:M199673)
=SUMIF(C2:C199673,T2,N2:N199673)
=SUMIF(C2:C199673,T2,O2:O199673)
=SUMIF(C2:C199673,T2,P2:P199673)
函数功能,判断年份列中的年份是否等于对应的年份,如果等于就将对应行中的关系相加求和
结果:

第四步,制作图表

原本到这里就完成,不过觉得如果做成动态的会更加有趣!
但是用代码敲的话,有些麻烦,并需要一些编程基础。
推荐一个在线制作动图网站
Flourish
无需编程基础就可以做出漂亮的动态图表
首先准备一个Excel表,输入统计表

进入网站
股权关系动态图表

上传数据即可!
也可以根据自己的喜好调整颜色,大小等
是不是很方便,我朋友觉得很酷!很满意!
并且可以发布!可以让别人下载和访问!
编辑一个HTML文件
<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>Document</title></head><body> <div class="flourish-embed flourish-bar-chart-race" data-src="visualisation/9458106"><script src="https://public.flourish.studio/resources/embed.js"></script></div></body></html>
发给朋友,就可以远程访问了!

总结:
虽然没有用Python做出来,不过也掌握了Excel的方法!
版权声明
本文为[华为云]所创,转载请带上原文链接,感谢
https://bbs.huaweicloud.com/blogs/349098
边栏推荐
- MySQL最新版8.0.21安装配置教程~
- ACID在MySQL里的底层怎么实现?
- vmware虚拟机下载并安装教程
- 被滥用的“架构师”!
- About the problem that the picture library of tpshop open source mall version 6.0 does not display pictures
- SPA首屏加载优化
- 启动mongodb时发现错误libcrypto.so.10
- 全网最详细KaLi系统配置和安装教程,我妈看了都会!
- 分析API响应慢
- [required for design!] Common color matching table for Web Design
猜你喜欢
随机推荐
Ffmpeg filtergraph adds both zoom and OSD filters
【SQL server速成之路】数据库的查询
多语言通信基础 05 go的grpc体验
084使用CVE-2017-7494漏洞实现Samba远程代码执行
[issue 307] in terms of implementation principle, why is Nacos so strong?
Three minute quick understanding of interactive graffiti
QByteArray的一些函数转换使用
「译文」给讨厌YAML的人的10个写YAML的建议
Tree DP - p1122 maximum subtree sum
API 网关的功能用途及实现方式
MyNodeQuery 1.0.2.2 发布,Ping节点指定IPv4或IPv6、仪表盘增加排序
OneFlow學習筆記:從Functor到OpExprInterpreter
PCIE XDMA IP核介绍(附列表)-明德扬科教(mdy-edu.com)
Google Adsense suggests that the advertising capture tool is wrong, which may lead to reduced revenue. What should we do
2022-04-17_ Function (I)
TC397 MCMCAN
谷歌AdSense提示广告抓取工具错误,这可能导致收入减少怎么办
MySQL基础合集
C语言进阶篇1-----------》数据的存储(原码反码补码+大小端判断+整型提升+浮点数的存储)
Spark 3.x 的 WSCG 机制源码解析











