Skip to content

wenjunmo/DataStory_Interactive-Visualization

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

50 Commits
 
 
 
 
 
 

Repository files navigation

🐋 DataStory_Interactive-Visualization 🐋

Seeking True from Fact 网新人,有态度,不认输,不头秃

标题居中代码如下,因为md是支持html语言的

<div align="center">
  <h1>:whale2: DataStory_Interactive-Visualization :whale2:</h1>
  <p>Seeking True from Fact 网新人,有态度,不认输,不头秃</p>
</div>

🔨 定义数据产品

  • 广义来看,数据产品是可以发挥数据价值去 辅助用户更优的做决策(甚至行动) 的一种产品形式。
  • 狭窄来看,淘宝数据魔方、百度指数、电商的 CRM 平台、各种公司内部的数据决策支持系统等都是数据产品,是已经有成熟的后台来进行数据统计的可视化
+ 所以基于上面我认为要来用数据产品来讲好数据故事的难点就是在于怎么来把握一个核心,也就是找到用户的 **真正核心需求、痛点**

🔧 定义数据可视化

  • 信息可视化(Infographic(Information Graphic)) 更注重艺术效果,它是具体化的、独立的、需要手工定制的。并没有任何一个可视化程序能够基于任一数据生成具体的图片并在上面标注解释性文字
  • 数据可视化[data visualization] 具有更广的普适性,同一类图表并不会因为数据不同而改变自己的展现形式,用户通过对数据进行可视化的应用来搭建报表。例如 网易有数
+ 所以基于上面我认为数据可视化是需要在洞察用户核心需求痛点的前提上,使用数据分析的形式,将数据故事呈现在图表中,并且判断出相关性与其结论,给出合理的建设性意见和解决办法

💡 Ptich DataStory

产品文档

世界500强企业中美经济结构的差异化探析产品文档

2019年世界500强中美公司行业对比分析探究

两国经济发展状况与国家实际形式不一样,在很多基础行业的重视以及发展上很不一样,但却都是世界两大经济体,在基于数据分析与信息可视化的操作筛选分析下,根据展示的图表结果推断出如下结论与解决方法:

结论:

一、均衡的美国和极化的中国

每个五百强企业都有其总部所在城市,而这些城市往往也在全球顶尖企业的发展历程中发挥重要的作用,甚至在一定程度形成了独特的文化。比如微软之于西雅图、苹果之于库比蒂诺、华为之于深圳等等。

美国全球五百强企业的总部城市广泛地分布在了31个州。美国的前两大(纽约和旧金山)尽管名头很响,但其实只分别拥有14个和6个五百强企业,而首都华盛顿和波士顿每城市都有分布。可以看到在美国五百强企业空间发展非常均衡。 而中国全球五百强企业的总部城市集中地分布在了北京,仅仅就是北京就是已经占据了56个差不多是快占据中国上榜总数的1/2了,可见集中程度之大。

二、健康与科技行业缺席的中国五百强企业

除了金融和能源外,在其他行业上中美两国的五百强强企业分布差异极大

美国五百强最多的行业包括批发零售、金融投资、金属能源以及医药制药。而中国百强最多的行业则集中在:电信电力、金属能源、石油煤炭以及银行证券金融投资,且大部分都是中国国家绝对控股公司。概括起来就是,中国上榜的能源资源与银行证券多,但缺少零售、健康和科技的行业巨头。尤其是健康和科技行业,在美国得到重视甚至在全球是朝阳产业但中国却缺席这一快速发展上升的行业。不仅如此,中国的医药制药是垫底,基建的公司排名靠后,并熟知的BATJAMD中国互联网巨头却排在后面,市值营收利润都没有办法与美国的谷歌亚马逊苹果等互联网巨头比肩,这一科技领域的差距还有很大的缺口需要填补和不断追赶。

三、中国上榜的五百强企业多且大但不强

在中国产权不清、利益不明、权责不清是我国国有企业的症结所在。虽然政府对企业垄断的默认与保护不是完全没有道理的,但是更应该是放权让更多有新鲜活力的企业来发展与接纳高新人才。企业多是好事,但是更应该把内在的质量做大做好。企业的科技研发与创新不足与中国的基础理论系统研究是分不开的,导致国际竞争力不强。

四、解决方法

  1. 正视中美之间以及中国与全球优秀企业之间的差距,并不断找寻突破口,善于抓住前沿科技来进行技术革新,带来新一轮的企业革命。
  2. 真正明晰企业产权,政府简政放权并且积极扶持新创公司的发展,为人才的引进与落户制定相应的政策
  3. 全力提升科技创新能力,科技创新是第一生产力,只有拥有核心技术,自己的企业竞争力就是最好的护城河。
  4. 勇于投身国际化竞争,不惧未来的资本风险挑战,做好随时准备革新的觉悟,迈开步伐脚踏实地才能带来发展。

五、预测未来新兴部分技术的发展前景

医疗制药,信息科技会逐渐受到重视,并且会在科技向善的时代将以人为本结合起来,对全球经济体制的重新构建具有积极的意义。

数据故事 交互过程见 pythonanythere 以及 ipynb 交互文档

依据最新发布的2019年榜单数据,了解全球最大企业的最新发展趋势。通过纵向不同年份和横向不同行业的比较,了解企业公司营业收入与利润等经营质量的变化。同时深入到国家或地区的研究可以揭示大企业群体分布的变化。

世界整体上分析

  • 2019年中国大公司数量首次与美国并驾齐驱,有 129 家来自中国,历史上首次超过美国(121 家)。

全球500强公司在全球分布状况

  1. 总数上,2019年全球500强公司中国上榜129家,美国上榜121家,远远超过第三名日本的52家,中美两国的世界500强公司席位占比占据了世界500强公司总数的一半,可以说全世界500强公司的收入一半都是流入了中国和美国。
  2. 地域分布上,1/2的500强公司都是分布在沿海地区和传统发达地区,与世界经济的发展水平趋势是一致的,大部分都位于美洲沿海,东亚以及欧洲西部,地域偏向两极化发展,亚洲欧洲美洲都有上榜公司。

全球500强公司在全球分布状况

世界500强公司营收情况

  1. 沃尔玛成为全球最大公司,中国石化位列第二,壳牌石油上升至第三位,中国石油和国家电网分列第四、第五位,新上榜的巨型石油公司沙特阿美则位居第六位。
  2. 上榜国家数量上,中国占据3个排在首位,美国两个排在第二。
  3. 中国前三的行业都属于国家绝对控股性质,其他有家族传承公司。
  4. 传统零售业是靠着实业慢慢聚拢财富和资源,但是强健有力的化工能源产业还是占据榜单居高不下,目前经济形势来说还是传统能源行业营收撑起世界经济支柱。

世界500强公司营收情况

世界500强公司利润情况

  1. 沙特阿美以近 1110 亿美元的超高利润登顶利润榜首位,苹果位列第二。利润榜前 10 位的四家中国公司仍然是工建农中四大银行,谷歌母公司 Alphabet 则以年度 142.7% 的利润增长率成功跻身前十强,位列第七。
  2. 公司所属性质个数上,石油占据1/10,投资占据1/10,电子占据1/10,互联网服务占据2/10,银行占据1/2,并且仅仅是中国就是占据了4家美国才1家。
  3. 沙特阿美是个个例,石油资源的利润率是众所周知,但是第二名的苹果以及第七名的谷歌母公司挤进世界前十,互联网服务业也占据一席之地。
  4. 沙特阿美的利润比第二名苹果几乎翻了一倍,而银行的利润却占据了前十的半壁江山,银行的利润收入还是较为可观的。

世界500强公司利润情况

中美之间的数据对比

中美上榜500强公司地域分布对比

  1. 中国上榜全世界前500强的公司中,北京56个占据榜首,比第二名台湾10个足足快多了5.5倍,第三并列为上海香港深圳,第四广州紧跟在其后,第五并列是浙江福建江西。
  2. 北京是中国上榜500强公司第一大聚集地,国家控股的500强公司都聚集在北京,台湾的制造以及服务业较为发达,也在榜单前列。身处沿海开放地带的500强公司,借助地域的优势,走在世界前列,但是中国上榜的500强公司分布不均匀,而是大部分集中在高度发达地区,发展地域不均衡。
  3. 美国上榜全世界前500强的公司中,纽约州19个占据榜首,与第二名加利福尼亚州相差3个以16个排在第二位,伊利诺伊州12个排在第三,明尼苏达州排在第四,俄亥俄州、华盛顿州和德克萨斯州并列在五。
  4. 美国上榜的世界500强企业并没有大幅度集中在发达地区,而是很有均衡地分布在31个州,发展比较均匀没有偏颇,看出美国很重视不同地域的协同发展,并没有特别偏颇重视哪一块地域的发展,比较健康。

中美上榜500强公司地域分布对比1 中美上榜500强公司地域分布对比2

中美世界500强公司营收对比

  1. 在中美世界500强营收前十中,中国仅仅占据3个,7个全都是美国,可见美国的占比还是挺高。
  2. 行业数量上,石油煤炭资源行业占据第一,医疗制药和批发零售紧跟其后,能源资源行业不出意料地排在前面,但前五中中国的能源资源国家控股公司有3个
  3. 值得注意的是美国的医药制药排在前十,说明美国很重视医药制药的发展。

中美世界500强公司营收对比

中国世界500强公司营收情况

  1. 个数上:分布在北京占据了7个,台北深圳上海各一个,资源在北京还是比较集中。
  2. 行业数量上,银行证券三个排在首位,石油煤炭与电信电力各两个在第二,基础建设通讯设备交通运输各一个都是在第三位
  3. 传统能源资源与银行证券在中国是持有较大比率,与中国国情密切相关。

中国世界500强公司营收情况

美国世界500强公司营收情况

  1. 个数上,公司分布较为分散,不会很集中,排在第一就是批发零售的沃尔玛
  2. 行业数量上,医疗制药5个排在首位,批发零售2个在第二,石油煤炭通讯设备银行证券各1个都是在第三位。
  3. 需要注意的是美国的医疗制药,虽然排名在后面但是分布在美国就占比占据了一半,可以说是支柱性产业与朝阳产业。,关乎国民生命健康的行业。

美国世界500强公司营收情况

中美世界500强公司利润情况对比

  1. 个数上,美国占据了6个,中国占据了4个,两者不相上下。
  2. 分布城市上,中国都是集中在北京,美国却是很分散在各个州。
  3. 行业数量上,7个是银行证券,美国占据了3个中国占据了4个,2个娱乐传媒都是美国的,排在第一的是通讯设备的苹果公司。
  4. 投资证券的回报率比较高,高于同时期其他行业的回报收入。

中美世界500强公司利润情况对比

中国世界500强公司利润情况对比

  1. 榜首的是中国工商银行,不仅如此,前5位都是中国银行证券公司,占据了总数的一半。
  2. 分布地域上,北京占据5个,深圳3个,杭州和新竹都是1个。
  3. 行业个数上,银行证券6个位列榜首,电信电力2个排在第二,批发零售和金融投资各1个都是在第三,银行占据了60%以上。
  4. 中国银行证券比较发达,并且与国家经济命脉息息相关。

中国世界500强公司利润情况对比

美国世界500强公司利润情况对比

  1. 榜首的是美国苹果公司,互联网产业的公司占据了3位,传统的投资公司和芯片公司都位列前面。
  2. 分布地域上,美国分布比较分散不集中。
  3. 行业个数上,银行证券4个位列榜首,娱乐传媒2个排在第二,通讯设备器材制造石油煤炭医药制药各1个都是在第三。
  4. 美国不仅是地域,在行业的个数分布也比较均衡。

美国世界500强公司利润情况对比

中国世界500强公司行业分布情况

  1. 电信电力23个排在第一位,金属能源和石油煤炭各12个排在第二位,银行证券与金融投资各10个排在第三,器材制造9个在第四,房地产8个在第五
  2. 传统行业的占比较高,特别是能源类,是国家的重点发展对象,同时也是国民经济的支撑。
  3. 但是医疗制药在垫底,这与中国国情很大关联性,基本的基础性行业基本相差不大

中国世界500强公司行业分布情况

美国世界500强公司行业分布情况

  1. 批发零售22个排在第一位,金融投资21个排在第二位,金属能源与医疗制药13个排在第三位,电信电力10个在第四,航天防务9个在第五
  2. 金融与零售业的占比较高几乎不相上下,金属能源和医药制药相同,可见在国民经济发挥很大的作用。
  3. 房地产基础建设化学工业等在垫底,也从侧面反映出美国行业的布局情况。

美国世界500强公司行业分布情况

📆 产品进度

  • ☑️ 19.12.13-19.12.15 数据产品或者是数据可视化项目的点子放在Github上面,将url填在腾讯文档上面,在12.15周日晚23点之前提交
  • ☑️ 19.12.15-19.12.18 组建团队-组队成功:莫文俊 刘瑜鹏 刘宇
    • < 15Days Pitch DataStory Product in PRD-MD to GitHub
    • < 15Days Show python ability in Jekyll to GitHub
  • ☑️ 19.12.18-19.1.05 提交最终 url 19days is enough but we should in advance to spend time in holiday
    • 12.18-12.22 实现见评分要求
    • 12.23-1.05 结束最终 url 放假 最终提交各自负责的入口url进行项目及文档提交
  • 🔲19.1.06-19.1.07 互评阶段,要求见评分要求

共同作品要求:

  1. 自己提供数据,但数据量>250个
  2. Html5界面设计包含CSS样式
  3. 必须部署在 pythonanywhere 并可用
  • 🔲19.1.08-19.1.10 互评公示及异议,要求见评分要求

⚠️ 评分要求

18级评分点:

  • 实现 交互功能 (Html表,至少做到表的交互没图假设下)
  • 实现 **部署在 pythonanywhere 可用
  • 基本README.md技术文档总结项目说明
    • 代码 GitHub URL
    • pythonanywhere url
    • 数据传输描述
  • 基本交互功能 Html控件使用丰富(加分项)

17级评分点:

  • 数据清洗和收集难度,数据集丰富程度
  • 交互功能对于强化数据产品或者数据故事表现力的程度
  • 交互界面 美观得体(使用Pyecharts、Plotly、CSS包含在内)
  • 整体数据产品/数据故事是否有洞见,给用户交互产生洞见的引导及可能性

简述之:

  • 共同要求:hurun数据/自己提供数据-国家统计局+H5页面设计包含CSS样式+pythonanywhere.com,是否有说服力和数据洞见-数据库,Flask
  • 18级评分:交互功能能否实现最基本的数据传递+是否上传到Pythonanywhere(最终提交github和pythonanywhere网址)+交互功能的丰富性(加分项)
  • 17级评分:交互功能对于强化数据产品或者数据故事的程度+交互界面是否好看plotly、pyecharts、网页CSS等渠道实现都可+数据产品/数据故事是否有洞见+数据清洗和收集难度,数据集丰富程度

18级评分踩点

18级《Python》开发人员:完成前后端(基本:仅表)交互的代码实践及文档写作,负责打底的HTML文档结构及交互控件实现及交互变数实践 17级《交互式数据可视化》产品经理/交互设计师:完成最小可行的交互式数据可视化产品设计,做出PRD及至少有2份成功交互且交互意义相关连(以超连结或交互达成)的交互式界面(其中至少1份含地图)的产品原型或完整产品,包括使用相关Pyecharts 及/或Plotly模块等等的整合外观样式及数据科学代码实践,以及外观样式的前端CSS 及Javascript库调用实践(如Bootstrap)

唯3位同学的团体需要多完成1项高阶交互功能,且18级《Python》不同开发人员的交互项目必需是不同的(但在同一项目是相连相关的)。

18级《python》评分点:
- 是否实现交互功能 (HTML表, 若17级不给力的话,至少做到表的交互没图的话)
- 是否实现在pythonanywhere布署可用
- 基本Readme.md技术文档之总结说明, 含項目之
  - 代码Github URL
  - pythonanywhere URL/云服务器的域名提交 URL
  - 数据传递描述, 
- 基本交互功能的HTML5控件使用丰富性(加分项)
- 4分(10%)github文档格式(包含基本的templates、static、app.py/main.py、数据文档(下载)/API数据)
- (20%)技术文档书写
  - 4分 HTML档描述(30%)
  - 4分 Python档描述(30%)
  - 4分 Web App动作描述(40%)
- (40%)数据交互(数据复杂度(是否存在与合理))
  - 4分 是否含有复杂数据结构的循环(列表循环、字典循环、集合循环)(20%)
  - 4分 是否含有合适的数据结构嵌套(20%)
  - 4分 是否含有合适的推导式(20%)
  - 4分 是否含有适当的条件判断(20%)
  - 4分 python 文档与html文档的数据交互(20%)
- (10%)自定义函数与模块功能(是否存在与合理)
  - 4分 函数和模块符合python PEP8标准(50%)
  - 4分 功能具有可扩展和丰富性(50%)
- (10%)HTML界面
  - 4分 实现数据的python——>HTML页面交互(如果Python有数据循环、复杂的数据结构,请务必检查前端是否正确接收到同样的数据传递结果)(80%)
  - 4分 符合jinja2标准(20%)
- 4分(10%)上传pythonanywhere/提交域名完善的个人网站
- (10%)加分项

未定稿]17级《交互》评分点:

- (25%)数据清洗和收集难度,数据集丰富程度
  - 5分:用python爬虫获得了数据,或者集合多个现有数据库的数据,且数据完整,有多层次可以供分析的角度
  - (get)4分:采用了自行寻找的单一数据库的数据,且数据完整
  - 3分:采用了老师提供的数据(胡润or碳排)
  - 2分:采用了自行寻找的简单数据,或者数据完整性欠缺
  - 1分:采用的数据杂乱,不成体系
  - 0分:没有数据来源
  
- (10%)整体数据产品/数据故事的选题是否有吸引力、有价值
  - 5分:选题很有社会价值,并且作品中的阐述方式新颖,很有吸引力
  - 4分:选题很有社会价值,作品的阐述方式比较好
  - (get)3分:选题的社会价值普通,但作品对其价值进行了比较好的挖掘(prepare)
  - 2分:作品阐述出了该选题的部分价值,但有些必要的信息没有进行挖掘
  - 1分:作品中对选题价值的阐述非常弱,看不到做的必要性
  - 0分:没有关于选题的说明
  
- (15%)【地图的】交互功能对于强化数据产品或者数据故事表现力的程度
  - 5分:交互设计极大增强了表现力,或者本项目不需要地图来表现交互可视化
  - (get)4分:交互功设计对项目的表现力有一定帮助
  - 3分:交互功能对项目的表现力可有可无
  - 2分:交互功能反而限制了项目的表现力
  - 1分:有可视化,但完全没有交互功能的设计
  - 0分:没有可视化
  
- (20%)【非地图的】交互功能对于强化数据产品或者数据故事表现力的程度
  - 5分:交互设计极大增强了表现力,或者本项目不需要地图来表现交互可视化
  - (get)4分:交互功设计对项目的表现力有一定帮助
  - 3分:交互功能对项目的表现力可有可无
  - 2分:交互功能反而限制了项目的表现力
  - 1分:有可视化,但完全没有交互功能的设计
  - 0分:没有可视化
  
- (20%)交互界面是否美观、得体(用plotly、pyecharts、网页CSS样式等渠道实现的都包含在内)
  - 5分:交互界面配色、字体、信息准确度和完整度都很优秀
  - (get)4分:交互界面配色、字体、信息准确度和完整度都有基本水准(prepare)
  - 3分:交互界面配色、字体妥当,但信息准确度或完整度有所欠缺
  - 2分:交互界面配色、字体不美观,且信息准确度和完整度有很多漏洞
  - 1分:只有少量的交互,或出现错误的信息
  - 0分:没有展示出交互界面
  
- (10%)整体数据产品/数据故事的交互设计是否能引导用户探索信息,产生有价值的观点
  - 5分:通过交互探索,我对这个主题有了非常深刻的认识,也能从交互中发掘出大量之前不知道的信息
  - 4分:通过交互探索,我对这个主题有了较多认识,也能从交互中发掘出一些之前不知道的信息
  - (get)3分:通过交互探索,我对这个主题有了一些基本的认识,但交互功能对我的探索过程帮助不大(maybe)
  - 2分:本项目展示出的信息,几乎没有超过我已有的知识
  - 1分:本项目展示出的信息,非常不充足,我可以举例出几个应该包含但没有被包含的信息点
  - 0分:本项目没有交互功能,或者没有数据信息
  

对互评结果有异议,请于1月8-10日在班级Q群提出。如果某位同学给出评价的项目中,有2个或以上被提出异议,并证实为互评不认真,给出评价的同学会被酌情扣分

🏁 产品目标及技术栈

💻 开发人员:

  • 前后端(基本:仅表)交互的代码实践及文档写作
  • Html文档结构及交互控件实现及交互变数实践

📊 产品经理/交互设计师:

  • 最小可行性的交互式数据可视化产品设计
  • 完成PRD及至少2份成功交互且交互意义相关联(以超链接活交互达成)的交互式界面(至少1份含地图)的产品原型或完整产品,包括使用Pyecharts/Plotly模块等整合外观样式及数据科学代码实践,外观样式前端CSS及JS库的调用实践(Bootstrap)

👬 合作伙伴

  • 🙋 有担当,共进退
  • 🙆‍♀️ 知道如何实现 Flask ,成功独立搭建过 Flask 框架,可以一起回顾,熟悉 html、css 更好,懂得如何处理数据链接和前后端响应
  • :person_with_pouting_face: 对产品负责,且有自己想法
  • :octocat: https://gitee.com/NFUNM065
  • 📞 18933815383 wx同号

链接:

--- OVER ---

About

DataStory_Interactive Visualization_Projects

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published