Masahiro Kasahara @mkasahara .@taroleo TL を見るに、パーソナルゲノムとか Illumina とか全ゲノムシークエンシングとかをビッグデータ的に話して、情報な人が、ACGTをテキストで使うとかどんだけ無駄、とか、シェルスクリプトで数百TBのデータ処理してるとか草不可避、みたいな流れだったくさい。 2013-08-26 13:14:16
Masahiro Kasahara @mkasahara .@taroleo TL を見るに、パーソナルゲノムとか Illumina とか全ゲノムシークエンシングとかをビッグデータ的に話して、情報な人が、ACGTをテキストで使うとかどんだけ無駄、とか、シェルスクリプトで数百TBのデータ処理してるとか草不可避、みたいな流れだったくさい。 2013-08-26 13:14:16
前回(BeautifulSoup で HTML 文書からタグを取り除く(Python) - やた@はてな日記)の内容でも,ある程度は問題なく処理できていました.しかし,大量の HTML 文書を渡してみると,新たに 2 つの問題が見つかりました.それぞれの内容と今回の対処は以下のとおりです. 深すぎる再帰呼び出しによる RuntimeError 例外 <p> を改行(<br>)の代わりに使っている HTML 文書や,バグ入りの自動生成プログラムにより作成された HTML 文書などが原因だろうと思います(未確認). 再帰呼び出しを使わずに ParseTree を探索するようにしました. 不正な数値文字参照による ValueError と OverflowError ValueError が送出される例:� OverflowError が送出される例:�
You didn't write that awful page. You're just trying to get some data out of it. Beautiful Soup is here to help. Since 2004, it's been saving programmers hours or days of work on quick-turnaround screen scraping projects. Beautiful Soup is a Python library designed for quick turnaround projects like screen-scraping. Three features make it powerful: Beautiful Soup provides a few simple methods and
http://anond.hatelabo.jp/20130825164553 http://anond.hatelabo.jp/20110824143747 コレ読んで書きたくなったので。 [基本的に学歴は重要] ・ベンチャーは大抵、創業初期~中期に「安い人材を育てよう」⇒「無理だコレ!」の流れを確実に経験してるので 学歴に関しては経験則として「能力とおおよそ比例する」という感覚を強固に持ってることが多いです。 あと、ベンチャー経営者は大抵「学生ノリ」を強烈に引きずっているので、母校の学生を好むことが多い。 低学歴の場合、突出した何かを持ってない限り面接もしない。してるヒマがないから。 ある意味、成功しているベンチャーの間口は大手より狭い。これは儲かってる中小企業にも言えることだと思う。 学生が入りたいと思うようなベンチャーは、意外に入社難度高め。っつーか、正直こんなとこ新卒で受けなくて
What RRDtool does RRDtool is the OpenSource industry standard, high performance data logging and graphing system for time series data. RRDtool can be easily integrated in shell scripts, perl, python, ruby, lua or tcl applications. News For the latest news regarding RRDtool, check the Announcements Mailinglist Archive. Or add our Facebook and Google+ pages. Download RRDtool is available for downloa
AIC (Akaike's Information Criterion, 赤池の情報量規準) は線形回帰の分析をするときによく用いる。(線形回帰は、多重回帰とも重回帰とも呼び、単回帰の場合も含む。線形近似と言っても誤解はあまり無いかもしれない。) このAICは、統計学の教科書の最後当たりによく現れる。使い道としては次の様になる。 「予測したい変数(以下、予測変数)があって、その予測に使いたい説明変数の候補がいくつもある時に、説明に使う変数(説明変数)の個数を増やせば、見かけ上、予測精度は当然上がるかのように見える。けれども、意味の無い変数(たとえば、ただのランダムな変数)を付け加えても見かけ上誤差が小さくなるだけで、その変数も使った予測式を使って新たな予測に使おうとすると、誤差が結局大きくなってしまう(この現象をオーバーフィッティング(過剰適合)と言う。だから、どの説明変数を(うまく選びす
あけましておめでとうございます。 本年もよろしくお願いいたします。 主成分分析 さて、昨年の終わりごろから、私は仕事で主成分分析を行っています。 主成分分析というのは、多次元のデータを情報量をなるべく落とさずに低次元に要約する手法のことです。 主成分分析は統計言語 R で簡単にできます。 例として iris データで実行してみましょう。 data(iris) data <- iris[1:4] prcomp.obj <- prcomp(data, scale=TRUE) # 主成分分析 pc1 <- prcomp.obj$x[,1] # 第一主成分得点 pc2 <- prcomp.obj$x[,2] # 第二主成分得点 label <- as.factor(iris[,5]) # 分類ラベル percent <- summary(prcomp.obj)$importance[3,2] *
What is a Crowdsourced Bug Hunt? Imagine tapping into a global community of expert testers, all working to ensure your web application is flawless. That’s the magic of crowdsourced bug hunts. This method harnesses the power of a global community of testers who use varied browsers, experience and usage patterns to find problems that might not be discovered by an in-house team.
8月15日の靖国神社。「社会勉強」の意味もあって教え子の大学生を連れて訪れた。日本社会の現状をウォッチできる「場」として以前から時々、この日の靖国神社に注目している。驚くのは若い世代の参拝客が目立っていること。戦争体験世代や戦没者の遺族、という人たちばかりでなく、戦争とは直接関係ない、ごく普通の若い人たちが増えている印象だ。昨年も同じように訪れたが、今年は参拝客がさらに増えているのが肌で分かった。8月15 日の靖国神社への参拝の光景からテレビや新聞などのマスコミがあまり報じない日本の変化を肌で感じとることができた。 参拝客はここ数年、15、6万人前後で推移している。参拝に積極的だった小泉純一郎政権の2005年に20万5千人、2006年に25万8千人と突出している。やはり、時の首相の姿勢が参拝者数に影響を与えるらしい。けっきょく、今年の参拝者は17万5千人と、昨年よりも1万4千人も多かった。
団塊の世代の人たちの需要が、今の日本の旅行産業を支えていると言われています。 彼らは年金も社会保障制度も(すくなくともこれからの人たちよりは)充実していて、悠々自適のリタイア生活を送っていると思われているのがその所以です。 いすみ鉄道で、イタリアンランチクルーズ列車などという1万円以上もする高級商品を発売して、それが瞬間的に満席になるような状況を見て、取材に来た新聞社の人が、「やっぱり団塊の世代ねらいですか?」と私に聞いてきました。 その人は、私の口から、「今の時代、やっぱりお金を持っている(と言われている)団塊の世代の人をターゲットとするのは当然ですね。」という答えを期待していたようですし、そういう答えならば記事にもしやすいし、読者もうなずくと思っていたのでしょう。 でも、私の答えは、「NO」です。 JRが計画している超豪華列車の旅は、団塊の世代の人たちのようなお金を持った老人
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く