|
原創 丑丑姐姐 專利阐發可视化
本文節選自WIPO Manual on Open Source Patent Analytics (2nd edition),重要先容了可用于專利阐發的開源東西。
本文所先容的東西可以分為八個種類:通用東西、数据清算東西、数据發掘東西、数据可视化東西、收集数据可视化東西、信息图建造東西、地舆数据可视化東西、文本發掘東西。上期文章先容了前面四種,本期文章先容收集数据可视化東西、信息图建造東西,下期文章先容最後两種。
PART 5
收集数据可视化東西
收集数据可视化可以或许将科學和技能范畴的钻研职員和他們之間的瓜葛举行直觀展現。在專利阐發中,收集数据可视化可以或许展現如下信息:
(1)展現在一個特定技能范畴中申请人或發現人之間的收集瓜葛。比方,下面的這张收集图以期刊文献的作者信息為阐發根本,展現了合成生物學范畴约莫2000位文献作者的互助钻研瓜葛。
(2)展現某一技能范畴中各個IPC或CPC分類号之間的技能聚類及联系關系瓜葛。
WIPO在其2014年公布的动物遗傳資本專利阐發陈述中就展現了這類信息。
洗碗手套,上图梳理了上万項在文献中呈現了农場養殖动物名称(比方牛、猪、羊等)的專利文献,從這些文献中找出各IPC分類号或CPC分類号在统一文献中呈現的環境,并用收集图把這些分類号在统一文献中共存在的瓜葛展現出来。图中的每個節點暗示一個分類号。節點之間間隔越近,阐明這些分類号在统一文献中呈現的次数越多,由此暗示這些分類号之間的技能類似度越高,而這些瓜葛慎密的分類号所触及的文献的技能联系關系度也就越高。而間隔相隔较远的節點代表的文献技能联系關系度則较低,好比烹调装备和动物的住房,這些集群中的文献便可以更快速地被解除。
(3)将專利文献中的關頭词及其與其他術语之間的接洽举行收集数据可视化,從而帮忙阐發职員摸索和完美响應的阐發事情。
也是在上述的动物遗傳資本專利阐發項目中,该陈述的作者将词干不异的词语汇集在一块兒以领會與动物育種有關的动物新品種有哪些。
是以,收集数据可视化既可以或许帮忙咱們對感樂趣的主題举行深刻阐發,又可以或许展現终极的阐發成果。
5.1 Gephi
Gephi()是一個基于Jave的開源收集图形線上看a片,天生软件。Gephi可以或许處置大量数据并出產壮大的收集图,不外這個数据量到底可以或许多大量仍是要取决于你電脑的機能。
当安装Gephi時可能必要面對的一個問題是,Gephi會提示你安装准确的Java版本。不外在最新公布的Version 0.9版本中已解决了這個問題。
在R中可以测驗考試利用rgexf包()和實例代码建立.gexf格局的收集图文件。
5.2 NodeXL
對付Excel的死忠用户,NodeXL()是一個很好用的插件,可以用来天生收集图。
5.3 Cytoscape
Cytoscape(www.cytoscape.org/what_is_cytoscape.html)是另外一個可以或许實現收集可视化的步伐,它最初是為了展現生物的收集和交互瓜葛而設計,可是與很多其他的用于生物信息學的東西同样,Cytos山楂減肥法,cape也能够被利用于其他范畴的数据可视化。
咱們可能更多的利用Gephi来建造網路图,不外Cytoscape真的值得一試。Cytoscape可以合用于Windows、Mac和Linux體系。
5.4 Pajek
Pajek()是最先創建的免费收集图建造東西,而且只合用于windows體系。它遍及用于文献计量學,可以處置大量数据。比拟厥後呈現的Gephi,Pajek没有那末機动,可是Pajek在切确性、易于复制性和易于保留性方面更具上風。而在上述方面,Gephi則稍有短缺。
對付那些更喜好Gephi建造的收集图的外觀和感受的用户,也能够将数据從Pajek导入到Gephi。
5.5 VOS Viewer
VOS Viewer()是由Leiden University開辟,其功效雷同于Gephi和Cytoscape,可是其收集图的样式與前二者分歧,主如果節點及其邊沿的视觉结果分歧。其最新的版本與Gephi和Cytoscape都可以或许@相%8妹妹p2%互@读懂對方的数据格局。若是想要测驗考試分歧的收減肚腩茶,集数据可视化的样式,VOS Viewer值得一試。而且VOS Viewer還可以或许读取Web of Science和Scopus数据库中的著錄項目数据。
5.6 Hive Plots
咱們其實不是十分清晰Hive Plots()是若何建造的,可是咱們很是認同Hive Plots對收集数据可视化目際的熟悉,即收集数据可视化的目際是為了将繁杂数据清楚化,而不是“看,我做了一個看起来很是像意大利面的工具”(虽然凡是這也属于咱們在建造收集图中的一個進程)。以是,咱們認為由BC癌症機构基懶人減肥法,因组科學中間的Martin Krzywinski開辟的Hive Plots很是有趣。
作為大型收集图的建造東西,在Python中有pyveplot()包和hiveplot()包,可用于Hive plots。
5.7 The R Graph Gallery和ThePython Graph Gallery
關于收集图的话題,值得举薦的網站另有The R Graph Gallery()和The Python Graph Gallery()。這两個網站中给出了很是多的操纵R或Python建造分歧可视化图表的代码,感樂趣的小火伴可以测驗考試一下。当你必要促進可视化技能或是追求一些立异的设法時,這两個網站不容错過。
其他可用于建造收集图的資本可以参考FlowingData()和Visual Complexity(),以得到一些灵感。
這些收集图在上述東西中建造好以後都必要输入图片,這就必要一些可以或许處置图片的软件。開源東西中,The GNU Image Manipulation Program(GIMP)()都是很轻易上手的图片處置止痛噴霧,東西。
PART 6
信息图建造東西
信息图在信息交換中盘踞了愈来愈首要的职位地方。信息图可以或许将一些繁杂的钻研成果用易于理解但又丰硕的情势展現出来。WIPO的專利阐發陈述就已公布了不少信息图。
信息图的大受接待见证了愈来愈多的在線信息图建造網站的發生,包含不少免费的網站。可是免费的網站會有一些利用上的限定,好比icon数目有限等。可是,作為一個正在不竭發展的范畴,這些缺點城市渐渐地被补充。下面列出了一些免费的、值得去摸索的建造信息图的網站。
6.1 Piktochart.com
6.2 Canva.com
6.3 Infogr.am
6.4 Visme
6.5 Easel.ly
6.6 Genia.ly
6.7 Venngage
6.8 Snappa
6.9 Mind the Graph
用于科學数据的在線可视化東西。
6.10 Kartograph
像Cool Infographics()如许的網站對付寻觅一些其他的可视化資本、可视化范畴的風行趋向、教程和若何避雷都是很是有效的。 |
|