Feature Hashing
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2022/11/21 14:38 UTC 版)
機械学習において、Feature Hashing(フィーチャーハッシング)は、高速かつ省メモリな特徴量をベクトルに変換する手法であり、任意の特徴をベクトルあるいは行列のインデックスに変換する。kernel trick(カーネルトリック)に似せてHashing Trick(ハッシュトリック)とも呼ばれる[1]。連想配列を走査するのではなく、ハッシュ関数を特徴量に適用し、その値をインデックスとして直接使用する。
- ^ a b c d e f Kilian Weinberger; Anirban Dasgupta; John Langford; Alex Smola; Josh Attenberg (2009). “Feature Hashing for Large Scale Multitask Learning”. Proc. ICML
- ^ a b K. Ganchev; M. Dredze (2008). “Small statistical models by random feature mixing”. Proc. ACL08 HLT Workshop on Mobile Language Processing
- ^ Josh Attenberg; Kilian Weinberger; Alex Smola; Anirban Dasgupta; Martin Zinkevich (2009). “Collaborative spam filtering with the hashing trick”. Virus Bulletin.
- ^ a b Owen, Sean; Anil, Robin; Dunning, Ted; Friedman, Ellen (2012). Mahout in Action. Manning. pp. 261–265
- ^ Shi, Q.; Petterson J.; Dror G.; Langford J.; Smola A.; Strehl A.; Vishwanathan V. (2009). “Hash Kernels”. AISTATS
- ^ Bai, B.; Weston J.; Grangier D.; Collobert R.; Sadamasa K.; Qi Y.; Chapelle O.; Weinberger K. (2009). “Supervised semantic indexing”. CIKM. pp. 187–196
- ^ “gensim: corpora.hashdictionary – Construct word<->id mappings”. Radimrehurek.com. 2014年2月13日閲覧。
- ^ “4.1. Feature extraction — scikit-learn 0.14 documentation”. Scikit-learn.org. 2014年2月13日閲覧。
- ^ “sofia-ml - Suite of Fast Incremental Algorithms for Machine Learning. Includes methods for learning classification and ranking models, using Pegasos SVM, SGD-SVM, ROMMA, Passive-Aggressive Perceptron, Perceptron with Margins, and Logistic Regression”. Code.google.com. 2014年2月13日閲覧。
- 1 Feature Hashingとは
- 2 Feature Hashingの概要
- 3 実装
- Feature Hashingのページへのリンク