【关键词】数据挖掘 物流管理 信息系统
现代物流系统是一个庞大复杂的系统,特别是全程物流,包括运输、仓储、配送、搬运、包装和物流再加工等诸多环节,每个环节信息流量十分巨大。现代信息化物流网络体系的应用使原来数据库的规模不断扩大,产生了巨大的数据流,使企业很难对这些数据进行准确、高效的收集和及时处理,因此也就很难帮助决策者做出快速、准确地决策,实现对物流过程的控制,降低整个过程的物流成本。随着知识经济和现代信息技术的迅猛发展,信息技术特别是网络技术的发展,为物流发展提供了强有力的支撑。物流管理信息系统是企业信息系统和企业信息化的基础,能够利用信息技术对物流中的各种信息进行实时、集中、统一管理。
数据挖掘(Data Mining) 能够挖掘蕴藏在海量数据中大量未知的和有价值的信息,为企业物流管理提供各种决策信息,减轻物流管理者从事低层次信息处理和分析的负担,使他们专注于最需要决策智慧和经验的工作,因此提高了管理和决策的水平。随着信息技术的不断发展,数据挖掘技术将为企业物流管理决策提供越来越强大的支持功能。
数据挖掘过程及关键技术分析
数据挖掘过程数据挖掘技术就是采用机器学习、统计、数学和可视化技术,从大量的数据库中识别出有效的、新颖的、潜在的、有用的以及最终挖掘出可理解模式的高级处理过程。有时人们也称它为数据库中的知识发现(KDD)。它利用数据库技术对数据进行前端处理,而利用人工智能的方法从处理后的数据中提取有用的知识。其挖掘过程可分为四个步骤:数据准备、数据挖掘、结果的解释和评价、用户界面。
数据准备:包括3个子步骤,数据集成、数据选择、数据预处理。在这个阶段中,需要搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据;研究数据的质量,为进一步分析做准备,并确定将要进行的挖掘操作的类型;将数据转换成一个分析模型,这个分析模型是针对挖掘算法建立的,建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。数据准备需要占用整个数据挖掘过程的60%工作量,这也说明了数据挖掘对数据的严格要求。
数据挖掘:对所得到的经过转换的数据进行挖掘,除了进一步完善挖掘算法外,其余一切工作都能自动完成。数据挖掘一般有两种方式,发现型的数据挖掘和验证型的数据挖掘。前者是让数据挖掘系统为用户产生假设,后者是用户自己对于数据库中可能包含的知识提出假设。
解释和评价:解释并评估结果,其使用的分析方法一般应视不同的数据挖掘操作而定。根据最终用户的决策目的对提取的信息进行分析,把最有价值的信息区分出来,并且通过决策支持工具提交给决策者,因此这一步骤任务不仅是把结果表达出来,还要对信息进行过滤处理,如果不能令决策者满意,需要重复以上数据挖掘过程。
用户界面:通常会用到可视化技术。选择合适的可视化工具,通过使用者证实发现的知识的可靠性。如果不能令使用者满意,需要重复以上数据挖掘过程。否则可以将分析所得到的知识集成到业务信息系统的组织结构中去。
关键技术分析基于数据挖掘的物流管理信息系统的关键技术主要包括数据仓库、数据挖掘、数据分析工具等。
数据仓库技术。数据仓库是来自多个源的数据的存储库,它可通过Internet将不同的数据库连接起来,并将数据全部或部分复制到一个数据存储中心。数据仓库倾向于一个逻辑的概念,它建立在一定数量的数据库之上,这些数据库在物理上是可以分开的。数据仓库通过Internet打破地域界限,将它们合成一个逻辑整体,把一个海量的数据库展现在用户面前。数据仓库管理系统的一项重要工作是实现对传统数据库进行提取、清理和转载到数据仓库中。
数据挖掘技术。这是整个系统的难点和重点,主要涉及模式模型和挖掘算法。目前,己形成了多种数据挖掘方法,如分类知识发现、数据总结、数据聚类、关联规则发现、序列模式发现、依赖关系或依赖模型发现、异常发现、趋势预测等。各种方法均有它一定的优点,也有它的不足。几种技术并不是单一的使用,而是根据实际情况综合的加以应用。现在一些流行的数据挖掘工具一般都包括了几种方法。如IBM公司Almaden研究中心开发的QUEST系统,SGI公司开发的MineSet系统都是多模式的挖掘工具。
数据分析工具。数据仓库虽然存有大量数据,但提供辅助决策的信息需要利用各种分析工具,如联机分析处理(OLAP)工具、统计分析和查询优化工具等。这些工具的性能对管理决策的效果有着重要的影响。目前已出现具有智能功能的强大的数据分析工具,这些分析工具不仅能在系统运行时采集和处理数据,同时也支持对其他业务系统的数据进行采集。
数据挖掘技术在物流管理中的应用
信息是企业最重要的有效资源,最大限度地提高信息的利用率是企业经营成败的关键。沃尔玛公司是现代物流管理在商业运用最好的例证。沃尔玛拥有由信息系统、供应商伙伴关系、可靠的运输及先进的全自动配送中心组成的完整物流配送系统,可以及时保证货品从仓库运送到任何一家商店的时间不超过48小时,相对于其他同业商店平均两周补货一次来说,沃尔玛可保证分店货架平均一周补两次。通过迅速的信息传递与先进的电脑跟踪系统,沃尔玛可以在全美国范围内快速地输送货物,使各分店即使只维持极少存货也能保持正常销售,从而大大节省了存贮空间和存货成本。沃尔玛的物流高效率是因为他们运用了最先进的数据挖掘技术,据统计,沃尔玛公司专门从事物流信息系统工作的科技人员有1200多人,每年投入信息的资金约6亿美元。
利用数据仓库和数据挖掘技术,沃尔玛对商品进行市场分组分析,即分析哪些商品顾客最有希望一起购买。沃尔玛数据仓库里集中了各个商店一年多的详细原始交易数据。在这些原始交易数据的基础上,沃尔玛利用自动数据挖掘工具对这些数据进行分析和挖掘。沃尔玛公司近年来用大容量的数据仓库来进行数据挖掘和客户关系管理,对其3000多家零售店的8万种产品时刻把握住利润最高的商品品种和数量。他们在从事由数据变信息,由信息变知识的知识挖掘工作,通过全球全集团、全方位、全过程、全天候的自动数据采集技术,改变传统的依靠假设和推断来确定订货的方式,从数据的不断积累过程中以小时为单位动态地运行决策模型,导出数亿个品种的最佳订货量与最佳商品组合分配,降价以及商品陈列等。