研究課題名 知識基盤形成のための大規模半構造データからの超高速パターン発見
研究代表者  有村 博紀 (北海道大学・大学院情報科学研究科・教授)
研究の概要  通信と情報技術の急速な発展を背景として,World Wide Web(WWW,ウェブ)が,現在,人間の情報処理能力をはるかに超えた人類史上最大の膨大な知の集積となっている。そのため,巨大なウェブから有用な知識を効率よくとりだすための技術が求められている。本研究では,来るべき知識集約的社会の基盤技術として,ウェブ空間に分散した膨大な知識断片を有機的に結合し,そこに内在する知識をパターンや規則としてとりだすことが可能な超高速半構造マイニングエンジン技術を研究開発する。さらに開発した半構造マイニング技術の理論的性能解析や,半構造マイニングエンジンを知識基盤形成に適用するための周辺技術の開発を行い,インターネット上での実証実験を行う。これにより,インターネット上の大規模知識基盤形成のためのアーキテクチャと実装技術を確立することを目指す。
研究者数・期間  4人(平成17年度〜平成19年度)

Title of project Efficient Pattern Discovery from Massive Semi-Structured Data for Knowledge Infrastructure Formation on the Web
Head Investigator Name Hiroki Arimura, Hokkaido University, Graduate School of Information Science and Technology, Professor
Abstract of Research Project

Number of Researchers : 4

Term of Project: 2005-2007
By rapid progress of network and storage technologies for the last decade, a huge amount of weakly structured electronic data of various types, called semi-structured data, is accumulated over networks. In particular, the World Wide Web (WWW, or Web) is the largest knowledge archive spread over the Internet that the human being ever had. We study efficient semi-structured data mining technologies that supports human discovery of useful knowledge from massive collections of semi-structured data on networks. In particular, we develop high-speed semi-structured data mining engines as a core of large-scale knowledge Infrastructure formation technology from the Internet and establish their architecture and base technologies.