论文部分内容阅读
在大数据时代,利用车辆移动数据研究居民出行行为,有益于政府和交通管理部门制定科学合理的城市管理策略。目前大多数研究工作都集中于公共交通领域,对私家车数据的研究相对较少。本文以真实的私家车数据为基础,研究城市中私家车用户居民群体的出行行为,主要工作如下:
为了从原始私家车数据集中获取到满足本项研究的基础数据,提出私家车数据集预处理框架对收集到的原始私家车数据集进行预处理。首先,提出以连续的几个冗余点均值替换所有冗余点的方法清洗GPS轨迹数据中的冗余数据;然后针对GPS轨迹中存在的噪声数据,通过启发式异常值剔除法消除噪声;最后,基于GPS轨迹数据和车辆行驶状态数据中对应时间信息,融合两种数据,获取私家车行程和停等点轨迹数据。
为了掌握私家车用户的群体出行行为规律,提出基于用户出行基本属性统计的分析方法对私家车用户的出行行为进行研究。首先,通过对描述私家车用户出行移动行为,如移动距离等基本属性进行统计并分析统计结果,获得私家车用户出行的整体移动规律;其次,通过对描述私家车用户出行停等行为,如停等时长等基本属性进行统计并分析其统计结果,获得私家车用户群体出行的整体停等规律。与此同时,通过拟合重要属性移动距离、移动时长以及停等时长的概率密度,发现这些重要属性在工作日和周末分别服从不同的概率密度分布。
为了判定私家车用户是否为有规律出行者,基于私家车用户的出行行为特征,本文提出一种半监督判定算法(TFC2-means)。算法分为分类模块和判定模块。在算法分类模块中,首先分别从单个用户的行程和停等点数据中依据特征提取公式计算获得私家车用户的出行行为特征。然后,从有标签样本中获得监督信息,即为训练过程添加约束,结合出行行为特征和约束信息划分私家车用户群体。在算法判定模块中,依据群体划分结果判定私家车用户是否为有规律出行者。实验结合真实的城市中的私家车出行数据,将TFC2-means与TAD算法比较,在准确率、查准率、召回率上分别提高了33%、19.07%和48%,验证了TFC2-means算法选取特征的合理性。将TFC2-means与传统K-means方法进行比较,在准确率、查准率、召回率上分别提高了12.5%、8.12%和22%。证明了TFC2-means算法约束添加的有效性。
为了从原始私家车数据集中获取到满足本项研究的基础数据,提出私家车数据集预处理框架对收集到的原始私家车数据集进行预处理。首先,提出以连续的几个冗余点均值替换所有冗余点的方法清洗GPS轨迹数据中的冗余数据;然后针对GPS轨迹中存在的噪声数据,通过启发式异常值剔除法消除噪声;最后,基于GPS轨迹数据和车辆行驶状态数据中对应时间信息,融合两种数据,获取私家车行程和停等点轨迹数据。
为了掌握私家车用户的群体出行行为规律,提出基于用户出行基本属性统计的分析方法对私家车用户的出行行为进行研究。首先,通过对描述私家车用户出行移动行为,如移动距离等基本属性进行统计并分析统计结果,获得私家车用户出行的整体移动规律;其次,通过对描述私家车用户出行停等行为,如停等时长等基本属性进行统计并分析其统计结果,获得私家车用户群体出行的整体停等规律。与此同时,通过拟合重要属性移动距离、移动时长以及停等时长的概率密度,发现这些重要属性在工作日和周末分别服从不同的概率密度分布。
为了判定私家车用户是否为有规律出行者,基于私家车用户的出行行为特征,本文提出一种半监督判定算法(TFC2-means)。算法分为分类模块和判定模块。在算法分类模块中,首先分别从单个用户的行程和停等点数据中依据特征提取公式计算获得私家车用户的出行行为特征。然后,从有标签样本中获得监督信息,即为训练过程添加约束,结合出行行为特征和约束信息划分私家车用户群体。在算法判定模块中,依据群体划分结果判定私家车用户是否为有规律出行者。实验结合真实的城市中的私家车出行数据,将TFC2-means与TAD算法比较,在准确率、查准率、召回率上分别提高了33%、19.07%和48%,验证了TFC2-means算法选取特征的合理性。将TFC2-means与传统K-means方法进行比较,在准确率、查准率、召回率上分别提高了12.5%、8.12%和22%。证明了TFC2-means算法约束添加的有效性。