作者
浙江大学:
- Zikun Deng
- Di Weng
- Jiahui Chen
- Ren Liu
- Zhibin Wang
- Yingcai Wu
京东智慧城市研究院
- Jie Bao
- Yu Zheng
摘要
空气污染已经成为世界上许多城市的一个严重的公共健康问题。为了找出空气污染的原因,必须在大的空间尺度上研究空气污染物的传播过程。然而,复杂和动态的风场导致污染物输送的高度不确定性。如果没有领域知识的整合,最先进的数据挖掘方法不能完全支持跨多个地区的这种不确定时空传播过程的广泛分析。这些自动化方法的局限性促使我们设计和开发 AirVis,这是一种新颖的可视分析系统,它可以帮助领域专家基于图形可视化有效地捕捉和解释空气污染的不确定传播模式。设计这样的系统提出了三个挑战:a)传播模式的提取;b)模式表示的可伸缩性;和 c)传播过程的分析。为了应对这些挑战,我们开发了一个新的模式挖掘框架来模拟污染物迁移,并从大规模大气数据中有效地提取频繁传播模式。此外,我们基于最小描述长度原则对提取的模式进行分层组织,并允许专家用户基于模式拓扑有效地探索和分析这些模式。我们通过使用真实数据集和领域专家的积极反馈进行的两个案例研究证明了我们方法的有效性。
Introduction
空气污染成为一个严重的公共问题
来源:
- Vehicle emission
- Incineration
- Factory emission
- Forest fire
挑战:
- 传播模式的提取
- 模式表示的可伸缩性
- 传播过程分析
- The spatial and temporal distributions?
- The role of the district in this pattern?
- The largest contributor to the air pollution?
贡献:
- 我们描述了分析空气污染传播的问题。
- 我们开发了一个新颖的基于有限状态机的模式挖掘框架,它可以有效地模拟空气污染物的传输,并从大规模大气数据中提取潜在的传播模式。
- 我们提出了 AirVis,这是一个可视化分析系统,使专家能够根据不确定性图可视化的拓扑结构,在层次上识别和分析污染传播模式。
Related Work
本节介绍了以前的研究,这些研究按三个相关主题分类,即空气污染的模型和数据驱动分析、时空可视化,以及子图挖掘和可视化。
Model-driven: 数学模型,Complex district-level interactions
Data-driven:neural network, Continuous propagation process
局限:
- Inherent uncertainties in the dynamic propagation processes
- Interactive visual analysis
Overview
Requirements
- 探索基于拓扑的模式概览
- 获取模式的时空概要
- 展开模式的不确定传播过程
- 找出模式之间的相似或不同之处
- 检查模式中的传播实例
Pattern Mining
Modeling Pollutant Transportation
更新空气粒子的位置:
L ( Δ t + t ) = L ( t ) + v ⃗ t × Δ t v ⃗ t = ∑ m ∈ M ( d n − d m ) × v m , t ∑ m ∈ M ( d n − d m ) \begin{aligned} L(\Delta t+t) &=L(t)+\vec{v}_{t} \times \Delta t \\ \vec{v}_{t} &=\frac{\sum_{m \in M}\left(d_{n}-d_{m}\right) \times v_{m, t}}{\sum_{m \in M}\left(d_{n}-d_{m}\right)} \end{aligned} L(Δt+t)v t=L(t)+v t×Δt=∑m∈M(dn−dm)∑m∈M(dn−dm)×vm,t
Constructing Propagation Graphs
Extracting Propagation Patterns
Visual Design
Characterizing Requirements
Three domain experts
- EA (Expert A), EB: Urban computing
- EC: Atmospheric science
Five requirements
- Explore a topology-based overview of patterns
- Obtain the spatiotemporal summaries of patterns
- Unfold the uncertain propagation process of a pattern
- Find the similarities or differences between patterns
- Examine the propagation instances in a pattern
Design Goals
- Hierarchical presentation of propagation patterns
- Uncertainty-aware visualization of pattern topologies
- Spatiotemporal visual summaries of patterns
- Intuitive illustrations of propagation process
- Comparative visual analysis of propogation patterns
- Detailed inspection of relational propagation instances.
G1: Hierarchical presentation of propagation patterns
G2: Uncertainty-aware visualization of pattern topologies
G3: Spatiotemporal visual summaries of patterns
G4: Intuitive illustrations of propagation process
G5: Comparative visual analysis of propogation patterns
G6: Detailed inspection of relational propagation instances
Evaluation
- Regional Analyses
- District-Centered Analyses
- Expert Interviews
Experts Feedback
- Visual designs
- Intuitiveness (motif, pattern glyphs, and pattern graphs)
- Depict complex propagation processes
- User interactions
- Smooth interactions
- Usability
- Finer granularity than the existing approaches.
Conclusion
Contributions:
- A problem characterization of analyzing air pollution propagation
- A novel FSM-based pattern mining framework
- A visual analytics system named AirVis
Future work:
- Incorporate fine-grained atmospheric data
- Improve our system for a wider audience
来源:oschina
链接:https://my.oschina.net/u/4382844/blog/4540370