String Kernels based on variable-length-don't-care patterns

Kazuyuki Narisawa, Hideo Bannai, Kohei Hatano, Shunsuke Inenaga, Masayuki Takeda

研究成果: 書籍/レポート タイプへの寄稿会議への寄与

抄録

We propose a new string kernel based on variable-length-don't-care patterns (VLDC patterns). A VLDC pattern is an element of (∑{∈})*, where ∑ is an alphabet and is the variable-length-don't-care symbol that matches any string in ∑ *. The number of VLDC patterns matching a given string s of length n is O(22n ). We present an O(n 5 ) algorithm for computing the kernel value. We also propose variations of the kernel which modify the relative weights of each pattern. We evaluate our kernels using a support vector machine to classify spam data.

本文言語英語
ホスト出版物のタイトルDiscovery Science - 11th International Conference, DS 2008, Proceedings
ページ308-318
ページ数11
DOI
出版ステータス出版済み - 12月 1 2008
イベント11th International Conference on Discovery Science, DS 2008 - Budapest, ハンガリー
継続期間: 10月 13 200810月 16 2008

出版物シリーズ

名前Lecture Notes in Computer Science (including subseries Lecture Notes in Artificial Intelligence and Lecture Notes in Bioinformatics)
5255 LNAI
ISSN(印刷版)0302-9743
ISSN(電子版)1611-3349

その他

その他11th International Conference on Discovery Science, DS 2008
国/地域ハンガリー
CityBudapest
Period10/13/0810/16/08

!!!All Science Journal Classification (ASJC) codes

  • 理論的コンピュータサイエンス
  • コンピュータ サイエンス(全般)

フィンガープリント

「String Kernels based on variable-length-don't-care patterns」の研究トピックを掘り下げます。これらがまとまってユニークなフィンガープリントを構成します。

引用スタイル