「クローラ」を含む日記

はてなキーワード: クローラとは

2025-02-05

■

あるコンテンツのクローラを書いてるんだが、schema.orgで特定のjsonをHTML内に定義できるようになっていて、そのjsonを見つけ出してダウンロードしてDBに保管する処理

これがまた面倒で、そもそもどこにそんなjsonがあるのか検討をつけないで虱潰しにやると時間がかかってしょうがない

そこで「こういうコンテンツはこういうURLのパターンで出てくるだろう」みたいにやるんだが、100%の精度ではない

精度と速度の間でトレードオフしてしまっているから、難しい

Permalink | 記事への反応(0) | 08:49

2025-01-22

■はてな匿名ダイアリーに跋扈するSCPについて

　ここ数年、インターネットに散在するコミュニティ上での異常事象の存在が、SCP財団内でしばしば議題に上るようになってきた。匿名性の高いSNSやコメント欄、掲示板はもちろんのこと、とりわけ「はてな匿名ダイアリー」（以下「増田」と呼称）においては、他のプラットフォームでは見られない特異なアノマリーが複数確認されている。増田は、ユーザー登録をせずとも誰でも簡単に匿名の文章を投稿できる点や、その内容が検索エンジンを介して幅広く閲覧されるという特徴を持つ。その結果、財団の観測網をかいくぐって潜伏しやすい土壌が形成されており、過去数年間で複数のSCPオブジェクトが確認されるに至った。

　本報告書では、増田上に跋扈するSCPについての調査概要と確認された事例、ならびに暫定的な収容手順を示す。なお、本報告書に示されるSCP事例は現在進行形で調査が行われており、記載内容はあくまで暫定的なものであることに留意されたい。

1. 背景と問題の経緯

　はてな匿名ダイアリーは日本国内を中心としたWebサービス「はてな」が提供するブログプラットフォームの一部で、アカウントを持たない投稿者であっても「増田」と呼ばれる匿名枠にテキストを投稿できる仕組みを提供している。そこでは個人的な悩みや告白、社会への批判や仕事・日常の愚痴まで、多種多様な文章が毎日大量に投稿されている。

　増田特有の気軽さや匿名性の高さは、投稿者の真意を推測しにくくする要因であり、その投稿を閲覧する読者側もまた「増田だから真偽がわからない」といった曖昧な認識のもと、批判や同情、考察などを寄せる。その混沌とした言説空間は、ときに不特定多数のユーザーの集合的な感情を刺激し、新たな炎上や論争を生み出す源泉ともなる。

　こうした特質はSCP財団から見ると、アノマリー（異常存在）が自己の活動や影響力を隠蔽したまま周囲に感染・拡散するのに非常に都合がよい環境といえる。特に増田では、投稿時に明確なユーザー IDやアカウント情報が残らず、内容の信憑性を裏付ける手段が事実上ないため、「書かれていることが虚実入り混じっている」前提で閲覧されやすい。結果として、何らかのアノマリーが潜入していても発見が遅れがちである。

　財団が増田における最初の異常を検知したのは、20██年頃に投稿された「この世を正しく終わらせる方法と手順」と題された増田が発端だった。その増田の内容はいわゆる「終末論」を扱うものであり、極めて支離滅裂かつ狂信的な文体ではあったが、読了した閲覧者の中から数名が突発性の精神不調や共時性の幻視を訴えはじめ、その症状が財団の監視ネットワークに引っかかったのである。その後、財団の調査チームが投稿の書式や文体を解析したところ、当該増田の背後に未確認のミーム汚染因子が潜んでいる可能性が高いと判断された。この事例をきっかけとして、財団は増田の投稿ログを精査し、複数のアノマリーを検出していくこととなった。

2. 増田上で確認された主なSCPの概要

　以下、財団が確認し、暫定的なオブジェクト分類（Safe/Euclid/Keter 等）を行ったSCPを紹介する。なお、詳細な文書は別途SCPファイルとして管理されているが、本報告書では概要と特徴を簡潔に示す。

2.1 SCP-増田-A：無限コメント自己増殖現象

オブジェクトクラス：Euclid

概要：増田の特定記事上でコメント欄が自動的に増殖し続け、システム上の最大コメント数を無視して延々と付与され続ける現象。ユーザーが投稿したはずのコメントが複数回重複表示されたり、「名無しのオブザーバー」というハンドルネームでシステムが自動生成したとみられるコメントが絶え間なく追加されたりする。最終的に記事本体よりもコメント欄が何十倍も長くなり、閲覧者がページを読み込むだけでブラウザや端末に極端な負荷をかける。

異常性：コメント数が増え続けるだけでなく、中には本文を改変するようなスクリプトが混入しており、ページをリロードするたびに本文の一部が改変・増殖する事例が報告されている。閲覧者が長時間そのページを開いたまま放置すると、ブラウザ履歴やクッキー情報を勝手に書き換える痕跡が確認されている。

暫定収容手順：財団エージェントがはてな側のシステム管理者に接触し、問題の増田を管理者権限で凍結。また、既に拡散したミラーサイトやアーカイブを順次削除し続けているが、完全な根絶には至っていない。現状、定期的にウェブクローラーを走らせ、類似現象の発生を監視・排除する措置を取っている。

2.2 SCP-増田-B：読心ミーム感染記事

オブジェクトクラス：Keter

概要：一見するとありふれた日常報告や匿名の愚痴を綴った文章なのだが、記事本文を最後まで読了した閲覧者の脳内に「その人物が最も不安に感じている秘密」や「他人に言えない後ろ暗い過去」を強制的に想起させ、それを吐き出させる形でコメント欄へ投稿させる現象。コメント欄の体裁を取りつつ、実際には閲覧者自身が投稿した認識のない状態で、勝手に恥部をさらすようなコメントが掲載される場合もある。

異常性：このSCPの投稿は複数回確認されているが、書式やタイトルは毎回異なる。共通するのは「冗長かつ最後まで読まないと内容がよくわからない文体」であることと、本文の終盤に読者の潜在意識を刺激する特殊な文章構造が組み込まれている点だ。財団心理学部門の解析では、いわゆる「ミーム改変文字列」が散りばめられており、読み進める中で読者の深層心理に干渉していると推測される。

被害と対処：実際に被害に遭った閲覧者は投稿後しばらくしてから自身のコメント内容に気づき、極度の羞恥や恐慌状態を引き起こす。財団は可能な限り対象投稿を速やかに削除し、被害者のコメント記録を抹消すると同時に、クラスA記憶処理を施して事態の収拾を図っている。問題は、このSCPが投稿される「増田」のアカウント特定が極めて困難な点であり、繰り返し新規 ID から投稿が行われていると推定される。新たな投稿が発生次第、いかに早期に検知し削除・封鎖するかが大きな課題となっている。

2.3 SCP-増田-C：擬似人格形成スレッド

オブジェクトクラス：Euclid

概要：ある増田上で連続的に展開される「複数の登場人物が互いに呼応しあう」形のスレッドが、実際には単一の存在（SCP-増田-C本体）の手によって形成されているとされる現象。日記本文とコメント欄があたかも多数の異なるユーザーによる対話のように見えるが、財団のIP解析ではすべて同一の不明ホストから投稿されたトラフィックであることが確認されている。

異常性：単なる自作自演ではなく、スレッド内で展開される複数の人格が、投稿のたびに微妙に文体を変化させるだけでなく、実在の第三者のようにリアルタイムで会話を重ねていく。そのやりとりは短時間で数百件以上に膨れ上がり、外部から見ると非常に説得力をもって「議論」が進行しているように映る。読者はそれぞれの人格が持つバックグラウンドストーリーに引き込まれ、スレッドを精読するうちに「どの意見が正しいか」を探り始めるが、最終的には一種の混乱状態に陥り、どの人物が何を意図しているのか判別不能になる。

被害：このスレッドに長時間深く没入した閲覧者は、自分の中に複数の人格が芽生えるような感覚を訴えたり、現実社会で他者と会話する際に「この人は実在しているのか疑わしい」という妄想を抱くようになるケースが報告されている。財団職員の複数名も監視過程で同様の症状を呈し、軽度の精神崩壊を起こした事例があるため、当該増田の監視担当者には定期的な心理カウンセリングが義務づけられている。

暫定対策：疑わしい長文対話形式の増田を早期に検知し、アクセス制限をかける監視システムを導入しているが、アルゴリズムの網をかいくぐる巧妙な投稿が頻発している。加えて、外部のまとめサイトに引用やスクリーンショットが保存されることで事後封じ込めが難航している。

2.4 SCP-増田-D：時間遡行編集記事

オブジェクトクラス：Euclid

概要：一度投稿された増田が、投稿時刻自体を過去に改変して再掲載される現象。通常、はてな匿名ダイアリーのシステムでは投稿日時を随意に改変することは不可能とされているが、このSCPは投稿履歴を操作して「数年前に投稿された」という形でエントリーを復活させる。

異常性：改変された記事は実在する日付の増田ログに紛れ込む形となり、当時の利用者のコメントやブックマークまで再現されている場合がある。過去ログを遡っていくと、該当記事がもともと存在した痕跡こそないものの、「当時その記事を読んだ」という証言を行うユーザーが現れるなど、現実改変の兆候も疑われる。現状の技術では投稿者の特定に至っておらず、どのようなプロセスで投稿日時を操作しているかは不明である。

注意点：時間改変系のSCPはカテゴリーとして非常に扱いが難しく、無闇な干渉は時間線に予期せぬ影響を及ぼす恐れがある。財団タイムアノマリー対策部門と連携しながら、記事そのものは閲覧制限下に置き、ネットアーカイブやウェブキャッシュの検索を遮断するなどの措置を行っている。

3. 調査と対策の現状

　これらSCPが増田上で確認された背景には、以下の要因が考えられる。

匿名性の高さによるアノマリー隠蔽

増田はアカウント登録不要で誰でも書き込みが可能であるため、投稿者を特定したり、過去の投稿傾向から異常を推定したりする難易度が高い。その結果、アノマリーの一次検知が遅れる傾向が強い。

はてなプラットフォームの構造

はてな匿名ダイアリーは、投稿された増田が多くのユーザーに瞬時に閲覧・ブックマークされる仕組みを持つ。また、はてなブックマークを介してさらにコメントや引用が拡散されるため、いったん話題が盛り上がると多方面にコピーや引用が散逸しやすい。

読者や閲覧者の「ネタ」への寛容さ

増田の読者は内容が真実か否かをあまり厳密に問わず、エンターテインメントやストレス発散目的でアクセスしている者が少なくない。結果、多少異常な文章であっても「一風変わった怪文書」「ただの創作」として受け流されやすく、深刻な異常だと気づかれにくい。

　こうした要因によって、SCPを含む異常投稿は容易に潜伏し、拡散する。財団としては、はてな運営会社との連携を強化し、AIを用いた自然言語解析による異常兆候の検知システムを導入するなど、対策を進めている。しかし、はてな匿名ダイアリーは日々膨大な数の投稿が行われるため、どこまで網を広げられるかは未知数である。また、海外ホスティングによるミラーサイトや転載が出現し始めると、現実的な削除要請の範囲を超えてしまう。すでにTwitterや他のSNSでもまとめが回ることで、被影響者が増加する事態は避けられない。

4. 今後の展望と留意点

　はてな匿名ダイアリーにおけるSCP存在は、ネットコミュニティの構造変化に応じて今後も増加する可能性が高い。特に「自らがアノマリーであると自覚していないままネット上で活動している存在」や、「人格を装いながら多人数の読者とインタラクションを行うことで自己増殖するミーム型SCP」は、増田のような自由投稿プラットフォームでさらに悪質化・複雑化する恐れがある。

　財団が最も警戒すべきは、増田を起点としてリアル社会へ飛び火するタイプのアノマリーの拡散だ。たとえば、本報告書で例示したSCP-増田-Bのように読者個人の深層心理に入り込み、現実での行動や社会的信用を毀損する現象が拡大すれば、大規模なパニックや社会秩序の混乱を招きかねない。あるいは、SCP-増田-Dのように時間改変的な特性を持つアノマリーがさらなる発展を遂げれば、歴史修正や因果律破壊といったレベルの被害もありうる。

　また、はてな匿名ダイアリーは日本国内だけでなく海外からも閲覧・投稿が可能であり、英訳や翻訳を介して国際的に広まる余地がある。財団の各支部やデータ分析班が協調して監視を強化し、各国の法規制とも連携して削除要請を進める必要があるものの、現実には各国プライバシー法や表現の自由との兼ね合いで対応が難航することが予想される。

5. 結論

　はてな匿名ダイアリー（増田）は、日常の雑感や炎上ネタから深刻な告白や感情の吐露まで、あらゆる情報が密集する場である。その匿名性ゆえに、SCPオブジェクトが潜伏しやすく、また多くのユーザーが「真偽のほどはわからないがとりあえず読む」態度で消費することから、アノマリーの拡散リスクは高いと言わざるを得ない。すでにSCP財団が確認しただけでも、いくつものSCPが増田に棲みついていることが判明している。

　ただし、全投稿を強制的に削除・監視するような強硬策をとれば、はてなプラットフォームの存続意義自体を揺るがすと同時に、財団の存在が表面化するリスクも高まる。一方で、アノマリー拡散を放置すれば、ネット空間を通じてリアル社会にも致命的な影響を及ぼす恐れがある。財団はこのバランスの狭間で慎重な対応を求められている。

　今後の具体的な方策としては、増田への新規投稿を常時チェックするAI 分析モジュールのさらなる精度向上や、異常記事をいち早く発見し隔離するための専用クローラの整備が必須とされる。また、読者側への啓発活動――「増田を閲覧する際には、妙に長文で意味不明な投稿には注意すること」「不可解な体験があれば速やかに共有し、アクセスを控えること」など――の実施も有効である。しかし、匿名の特性ゆえに抜本的解決策は見通せていない。

　財団としては、はてな運営との連携強化を引き続き図り、相互に対策技術をアップデートし合う形でアノマリーの早期封じ込めを目指す。SCP財団が確認した増田におけるSCP事例は氷山の一角に過ぎず、さらなる Permalink | 記事への反応(2) | 15:12

2024-11-23

■anond:20241123132017

自作クローラ

Permalink | 記事への反応(1) | 13:21

2024-09-02

■anond:20240902154702

クローラならマルチプロセスよりもマルチスレッドの方がいいかな

ボトルネックはネットワークのio待ちになるのでメモリ節約できるスレッドでやったほうがいい

Permalink | 記事への反応(0) | 15:48

■anond:20240902153921

なんで「でもたまにマルチスレッドはフル活用するんだよねクローラとか」って話からマルチプロセスの話になったの？

Permalink | 記事への反応(0) | 15:46

■anond:20240902152235

でもたまにマルチスレッドはフル活用するんだよね
クローラとか

そうとも言えるし、そうではないとも言える

結局クローラなんてIO待ちなので

Permalink | 記事への反応(0) | 15:24

2024-06-11

■anond:20240611152415

ソフトウウェアエンジニアリングの世界って広くて

例えば君も当然知ってると思うがGoFなんかもscrapyに限らず特定のツールやライブラリなんかは「知らない」と思うよ

まずその広さを知るのがプロの第一歩

クローラ開発の文脈で今までのに手を入れるのではなくて一から全部作るのを「フルスクラッチ」と表現するのは英語的にはともかく間違ってはいないと僕は思うよ

ただ、クローラのスクリプトとか普通は使い捨てだよね

再利用できるように書かないし実際君もOOPとかよく知らんじゃん

Permalink | 記事への反応(0) | 15:29

■anond:20240611145636

クローラをフルスクラッチ

そろそろ俺の腹筋が持たない笑

Permalink | 記事への反応(1) | 14:59

■anond:20240611133255

クローラにフレームワークなんて使っていない

笑

いやマイクロサービスだろ？

RESTかなんかでやりとりするだろ？

普通 Djangoとか使うでしょ笑

全部書いたの？

Permalink | 記事への反応(0) | 13:36

■anond:20240611120830

AWSでマイクロサービスアーキテクチャをやっている。

これもパワーワードだな

クローラ
フロントエンド
Elasticsearch
バッチ処理 (cronサーバー)
という4つが動作中。

このキーワードだけ並べた感

EC2で動かしてそうだ

Permalink | 記事への反応(1) | 13:25

2024-05-22

■

ニュース記事って少し時間経過すると端から消されてて困るから、誰か魚拓取るクローラでも回してくれねぇかな

Permalink | 記事への反応(0) | 14:46

2024-04-01

■お絵描き 趣味の人間が画像生成AIを使ってみた

その結果が以下。

https://i.imgur.com/UBzZTBy.jpeg

このラフがしっかり仕上げされる形になってて本当にびっくりした。

ここまで来るのに環境構築も含めて5時間もかかってない。

軽く自己紹介すると、ワイはお絵描きが趣味でIT系の仕事をしとる人間や。

最近のTwitter上のオタク界隈はAI絵の炎上が絶えない。

Stable Diffusion は出たての頃にちょっと触ってみたんやけど、何百枚も生成して使える絵は片手で数えるほどだったという印象があってそのあとはあまり真面目に技術を追いかけとらんかった。しかし最近の炎上を見てて、技術的にどこまで可能でどこからが不可能になるのか確認したくなり、もう一度環境構築からやり直すことにしたんや。

Stable Diffusion の WebUI の Docker 版を入れて、イラストに特化したモデルを入れて、VAEで画像のボヤけを解決し、噂の ControlNet を入れてみて、手元にある未完成の絵のラフを Canny につっこんでみて、プロンプトとパラメータを調節したらこの出来やで。

正直ワイが仕上げするよりうまいやん、と思ってしまった。

ちなみに貼った生成画像は無修正や。プロンプトにキャラ名は入れてないで。

何やろうね、このなんとも言えない気持ちは。

もしもワイにとって絵が道具やったら、簡単に十分なクオリティの絵ができてラッキーだと思っとるところやと思う。

でも、ワイにとって絵は目的やったから、描くこと自体が楽しいものやったから、理不尽な物言いだとは分かってるけど、それを奪われたような気持ちになったというのが一番近い表現やと思う。

というわけで当初の目的だった技術的に可能な点不可能な点を探るってのは今んところ不発に終わってるわけやけど、ワイが1年以上前の Stable Diffusion に触ってて思っていたところよりもよっぽど先まで話が進んどるんやな、とは思った。

正直、ワイみたいに描くこと自体が目的のヤツは少ないやろうな、と思う。大多数の人にとって絵は自分のブログ記事やプレゼンの資料を飾るための道具や。だから、この技術が今は法的に決着がついていないところを抱えているけど、それにはそう遠くない未来に決着がついて、一般に普及すると思う。

この技術がなかった頃にはもう戻れない。

せやから、ワイはこの技術と向き合っていきたい。それは、積極的に絵に活用するって話やない。この技術がある世界でもまだ絵を描き続けるという選択や。

別にプロでもなんでもないワイがそんなことしてても世の中何も変わることないとは思うけれども、でも、ワイはやっぱり絵を描くのが好きなんや。

ワイより上手い人たちはいっぱいいるけど、それでも絵を描き続けてきたんや。機械がワイより上手い絵を生成するようになったからって、そんなの今更やめる理由にはならんで。

【追記】

ブコメやトラバ、サンガツやで。

一つだけリプするわ。

お前の絵を見たい奴はAIに頼むようになるし、お前の絵はAIのためのクローラしか見に来なくなると思うよ。誰にも伝わらないなら、いったい何のために表現するんだ

絵は鑑賞されてこそ作品という考えやな。

ワイはネットが普及する前から絵を描いてるから、絵を見てもらえてないことが数字化される pixiv や Twitter も相当気持ち的には辛かったで。

今だって誰にも見てもらえないとまでは言わんけど、万バズとかいう言葉からは遠く離れた人間や。

でも、見てもらえないという現実と絵が完成したときの見て見て！っていう気持ちの落差があっても絵をやめることはできなかったんや。

だから、たとえ核戦争が起きて自分だけ地下シェルターで生き残って誰にも会えずに死ぬのを待つだけになったとしても描ける。そんな気がするんや。

カッコつけすぎやけど、正直な気持ちやで。

Permalink | 記事への反応(11) | 18:47

2023-12-10

■白いピンポン玉を求めて：純粋な娯楽への回帰

僕は弱者男性プログラマーだ。コードを書いて金をもらっている。

そんな僕が、社会学や政治に興味を持つ人が多いこのような場で物申すというのはちょっと変だと思うかもしれない。

実際、社会学なんて僕の専門じゃない。

僕はコンテンツを収集するクローラを書いたり、それを検索できるようにインデクシングしたり、あるいはコンテンツのクリック履歴に基づいておすすめを表示させたりするプログラムを書いている。

このようなプログラムにも、社会的側面というのは存在する。利用者が何らかの目的によってその検索ツールを利用し、調べたいものにたどり着く。コンテンツプロバイダー、ユーザー、システムという3つのアクターの社会が形成されている。

社会学者がコンピュータについて語ることがあるぐらいだから、プログラマーが社会について語ってもいいだろう。

僕が常々思うのは、人々の目的だ。

つまり「この検索ツールを使う人は、一体なにがしたいんだ」「コンテンツを提供する側は何が目的なのか」ってこと。

もっと状況を限定するために、「ブログ検索」というツールについて考えてみよう。君がクエリを投げてブログを調べようと思うのは一体どういうときなのか。あるいはブログを書こうと思う人たちの動機は？

動機は基本的にneedとwantによって分類されると考えて良い。needの場合、例えば確定申告書の書き方について調べていて、適切な情報を知りたいと言ったケースがそうだ。

wantというのは社会的な本能に結びついている場合もあるし、退屈しのぎということもある。承認欲求は基本的に社会的欲求だし、ハッカーが自分の知見を公開するのはちょっとした挑戦だろう。

リーナスの法則というのを聞いたことがあるだろうか。マズローの欲求解創設と似たようなもので、「生存」「社会」「娯楽」という3つが人の行動原理だとリーナス・トーバルズは言っている。

ブログを書くのが「生存」目的という人はどういう人だろうか。きっとそれ以外に職がなく、必死にアフィリエイトで稼ぎを得ている人だろう。

ブログを書くのが「社会的目的」という人は、すごいことをして認められようとか、専門家とつながりたいと考えているかもしれない。

しかし「娯楽目的」というのはもっと崇高なものに思えてくる。ブログの文章を書くのが単純に「楽しい」といった人たちのことだ。

生存、社会、娯楽という3つの階段によって、コンテンツの質というものが判断できるのではないかと、僕はそういう仮設を持っている。

アフィリエイトで生存的目的の発信をしている人たちのコンテンツは、お世辞にも良いとは言えない。クリックベイトであったり、感情を煽ったり、SEOをクラックしたり、初心者的だったりする。

社会的目的の人たちはもう少しマシで、認められようとして努力をする姿勢がある。でも、「たくさんの人と繋がりたい」という目的の場合はちょっと注意が要る。結局、そういう人は手当たりしだいにアクセスを増やそうとするから、コンテンツの質は下がってしまう。

「文章を書くのが楽しいけど、人に評価されることはどうでもいい」という人たちのコンテンツを探すことは難しいが、こういう人たちのコンテンツは奥深いことが多く、表面をなぞったようなアフィカスブログとは一線を画している。

しかしこれはコンテンツを提供する人の観点である。これらのコンテンツをクロールし、検索できるように整備している「システム」の観点から見ると、どうしても「広告利益」のようなものが重要視されやすい。

Googleであれば、Googleの広告利益に貢献するようなコンテンツを検索結果で優先表示するかもしれない。そしてそれはまさに生存欲求のためのアフィカスを優先しているのと同じことなのだ。

インターネットがつまらなくなったと言う人たちがいる。僕は次の喩えでこれを説明しようと思う。

昔のインターネットというのは、水の上に白いピンポン玉が浮いていた。この白いピンポン玉は良いもので、楽しいものだ。

ところが徐々に黒いピンポン玉を投下する人たちが増えてくる。黒いピンポン玉は悪いものだ。手を使って沈めようとしないと、白いピンポン玉が見つからない。

そして今のインターネットは黒いピンポン玉が一番上に浮かんでいて、白いピンポン玉はその下で見えなくなっている。

白いピンポン玉は純粋な娯楽精神を持ったコンテンツのことで、黒いピンポン玉は「アクセス数を増やしたい」がために鬱陶しいことをしているコンテンツのこと。

つまり、インターネットでは年々白いピンポン玉を見つけるためにエネルギーを使う必要が出てきてしまっていて、疲れているときは必然的に黒いピンポン玉を見るしかなくなっているということだ。

リーナスは「文明は、生存、社会、娯楽という段階に進んでいく」と言っていたが、インターネットは「娯楽、社会、生存」という逆の階段を降りている形になっているように思える。

現段階では、アテンションの総和が一定であるために、ネット人口が飽和し、広告企業の利益は落ち込んでいる。純粋な娯楽ではなく、企業の生き残りをかけた戦争に突入してしまっているのだ。

僕は今のインターネット社会では、意識的に面白いコンテンツを見つけるためにエネルギーをかけることがかなり重要だと思っている。ダラダラとやっていたらアフィカスとバズ目的しか目につかない。

例えば人間が一日に読める文章量なんて限られているから、本当に面白い人を見つけたらRSS購読しておいたほうがいいと思う。

うるさいハエがクソに群がっている。「クソを美味しくないと思うなら、お前がつまらない奴だからだ」と左翼思想家が指摘するかもしれない。

僕はクソよりもステーキが好きだ。あなたのようなハエではなく、人間だからだ。

Permalink | 記事への反応(1) | 11:56

2023-07-11

■TATSUROの罪は何か、「正しい」以外は失敗になる社会について

つらつらと今のネット社会について思ったことがあるので、前者を話の出汁にして及第点を許さない・許すことが出来ないネット社会構造について書き散らしたいと思う。なお、筆者は別にTATSUROのファンではないしCD等も持っていない。また本件の松尾氏に対する言及については主題と外れるので取り上げない。

TATSUROのラジオでの発言について

まだ内容を知らないなら、radikoのタイムフリー（一週間以内）で聞いてくるかニュースサイトの書き起こしを見て欲しい：

https://radiko.jp/ （山下達郎の楽天カードサンデー・ソングブック, 7/9 14:00 TOKYO FM を始め全国 JFM 系列の局）
https://encount.press/archives/483671/ （書き起こし）

さて、その上で次の質問を投げかけたい。果たしてTATSUROは「ジャニー喜多川の性加害」を擁護しているのか。それともしていないのか。しばし、お考え願いたい。

：

答えが「している」の方はハズレ。そして「していない」の方もハズレ。正解は「本当なら問題だと考えるが、自分が把握していないのでコメントできない」。つまりノーコメントだ。

自分が考えるに、これおそらく次のような建付けで説明できると思う。

1. TATSURO本人はその噂は聞いたことがあったが、真実であるかを判断するほど情報を持っていない

2. ジャニーズ事務所も今に至るまで創業者による性加害を「あった」と認定していない（ https://www.johnny-associates.co.jp/news/info-700/ ）

3. よって会社を代表するアーティストとしては「あった」ことを前提としたコメント出来ない。

これに対して、過去の裁判で加害の事実が認められているではないか！　卑怯である！　という反論が予想されるし、個人的にはTATSUROの発表には最高裁での判決を知った上でのコメントが足りていなかったと考える。ただ、今がトレンドとジャニー喜多川の性加害問題について多くのメディアでも盛んに取り上げられているが、ならば現在、彼や事務所と取引があった組織がどれだけ氏の所業について声明を出しているだろうか？

念の為だが、だからTATSUROの対応も許されるということではない。吉田豪氏がヤフコメで指摘していた通り、薄っすらと業界全体が共犯関係にあり、うかつに声を上げられないところが問題なのだろう。さらには現ジャニーズだけではなく、独立した元SMAP（新しい地図）や元TOKIOなどにも延焼しかねないし、事務所を辞めたジュニアの人にすら風評被害が出てしまうかもしれない。松尾氏が口火を切って声を挙げたことは偉大ではあるが、個人ではなく会社組織となるとそう簡単には動けないのだ。当然、松尾氏もそれは想定した上で、声を上げようと呼びかけているのではあるが……

（自分としては、だからジャニーズ事務所本体が早急に創業者による加害を認め、外部委員会や透明性のある組織改革、看板の付替えなどで心機一転し、責任を持って業界全体を巻き込んで芸能界の清浄化に取り組むのが筋であるとは考えている。）

次は、ならばTATSUROはその加害について言及する必要があったのか検討したい。

TATSUROとしての説明 責任。ただのヒラ作曲家なのか音楽業界の重鎮なのか。

私見ではあるが、ジャニー喜多川の性加害について説明責任が発生するのは現段階ではジャニーズ事務所および加害に関与した者のみであり、それに関与せず単に所属タレントの活動に関係していた作曲家や振付師などには発生しないと考える。

そこで、もう一度番組での発言に立ち戻りたい。もし時間が許すならば彼の発言をもう二回「イチ音楽家」および「長年に渡り音楽業界を引っ張ってきた重鎮」の言葉として読み直して欲しい。

：

いかがだっただろうか。思うに、前半と後半の論調の違いに違和感を覚えたのではないだろうか。そう、このコメントは、前半はスマイルカンパニー代表として会社の代理、そして後半は一介の音楽家としてジャニー喜多川およびジャニーズへの想いの吐露という構成になっている。そう、TATSUROという唯の音楽家としての、だ。松尾氏の契約解除にジャニーズへの忖度が疑われているなか、なんでそんなことするんじゃいと頭を抱える行為だが、音楽家としての彼はジャニー喜多川の功の部分について語らざるを得ないのだろう。

ここで重要なのは、あくまでのTATSUROはあくまでも音楽家として「私」を語っているつもりであるということだ。そして不幸なのは、週刊誌などの好奇心の徒が興味を持っていたのがジャニー喜多川と音楽を通じて縁があったことに対する反省・釈明であったことだ。なぜあんなにも大量の性被害を生み出したジャニー喜多川の肩を、今やシティポップで海外にも名が轟くTATSUROが持つのかと。

そう、求められていたのは、TATSUROという音楽界を生き抜いてきた重鎮が、責任感を持って性加害問題へ言及することであり、それによって歩みが鈍いジャニーズ問題に進展が見られることだった。筆者も正直その方向性の声明を期待していたところがあるので肩透かしであったし、前述したように最高裁による裁判結果という事実は参照するべきであったと考える。

さらにここからはラジオ聴き個人としての意見だが、自分にとって先日のサンソンはTATSUROの生き方をそのまま出力したようなものに感じた。週刊誌等の俗事な話題を厭い、一身上の理由のみ告げる。なので、全く持って現状の炎上状態に対応するには未熟で不適切であると同時に、（氏の中で）一貫して筋は通っているな、と感じた。特にファンではない自分がそう感じる程なのだから、曲を聞き続け、ライブにも通っていた氏のファンのアンビバレンスは想像に難くない。

期待された正しい振る舞いが得られなかった場合に、高度情報化社会ではその反応が画一化してしまうことについての懸念

ここからが本駄文の本題。

ここまでにグダグダと書いてきたように、長々６分も使ってラジオで述べたTATSUROの対応は、ジャニーズ事務所のゴタゴタに端を発する松尾氏のスマイルカンパニー契約解除事件へのものとしては上手いものではなかった。そして連日のように彼のどこがマズイか諸々記事が生み出され、はてぶでを騒がせている。首肯するしかない理性的な論説もあれば、偏見に基づいた単なるアンチが皮を被っただけのゴミもある。しかし、一貫しているのは彼は失敗したという前提だ。つまり、何が大衆の心を逆なでし、何が更なる炎上を招くのか。これはネット社会では数多くの物事が炎上してきた結果、その都度に識者がなぜ炎上したのか解説記事を書き広めてきたことの成果だ。

これによりネット民の炎上リテラシが向上し、やれ謝罪文がテキストではなく画像だ、検索クローラを拒否している、被害者に対する謝罪が条件付き謝罪だ、などなど「正しくない」炎上の型が言語化がされてきた。これ自体は社会全体の知識の向上であり当然ではあるのだが、最近は「正しくない型」にハマっているとそれ自体が罪とされているような感覚がある。本来はそれらは当事者の間で決着を付けることで十分なのに、ネット民が「型」を定規のように振り回し、それがいかに正しくないかおもちゃにして遊ぶような。

そしてこれは謝罪文だけに限らず、どんな事柄に対してもSNSで尤もらしい解説や批判が一斉に広まって、そしてフォロワーがそれを縮小再生産して再びばら撒く。これが正しい知識である場合は問題ないし、歓迎することでもあるとは思うのだが、ただそれなりに長くネットをやっていて感じるのは、結局はそれは知識として深く根付くことはなく、単なる善悪の物差しとしての判断基準になっているのではないか。専門家が専門家足るのは状況に応じて適切な対応が取れるからなんだが、単なるSNSのユーザである我々にそれ程のものがあるのか。

そう考えると、松尾氏とTATSUROのこの問題は、突き詰めるまでもなく当事者間の契約問題の話であり、外野がそれを酒の肴にして相応しい相応しくないと論じるのはなんだかなあと感じている。

（個人的には週刊誌のゴシップ記事は情報源が曖昧なものが多くあまり好まないのだが、最近はてぶでは多く見かける気がしている。文春による調査報道で週刊誌の記事がエントリーすることが多くなったからだろうか？）

Permalink | 記事への反応(1) | 19:15

2023-05-29

■乳輪35

フォロー・フォロワーが0のTwitterアカウントで、頭に浮かんだ言葉をツイートし続けている。そうしないと気が狂うし、これをやってると気が狂うともいえる。知らん。

閲覧数は常に1か2だ。Twitter社の検閲用のボットとか、公式クローラとかが1を踏んでるのかな。で、偶然日本語圏の誰かの検索に引っかかって2。日本にそれまで存在してない言葉の組み合わせをTweetしてるからね。

で「乳輪」という単語が含まれる場合だけ閲覧数が35増える。わざわさわ新料金体系のAPIで乳輪サーチしてるやつが35法人いるってこと？

インターネットなんか消え失せちまえばいいんだ。サメになって海底ケーブル踊り食いだぜ。

Permalink | 記事への反応(6) | 18:07

2023-01-01

■2023は社会影響を防御してコンテンツ消費すんぞ

自己防衛、投資、あと海外移住、日本脱出だよね。

いやただの俺の個人的な目標なんだけどね。

なんつーか、何が楽しいとか嫌いとか、そういうのを社会の色んな情報に左右されすぎちゃったなってね。

反省点ではあるんだが「トップガンが流行ってます！」って情報があって、それで映画を見たとして、流行っていなかったとしても楽しいと思えたんかなって。

それで新年の最初の目標は、ネット上の情報に何らかの「数」が付与されている場合は、それを隠すようなfirefox プラグインを自分用に作ろうかなと。

フォロワー数、イイネ数、反応数、ビュー数、レビュー数、などなど、ノイズにしかならない「数」情報。

極めつけは経済情報を俺が収集し始めたことに関係してるんだよね。

まず人を騙そうとしている嘘が多いし、嘘に限って何らかの「数」が多い。

仮に嘘ではなくとも、俺の人生目標とあいつらの人生目標が全然違うから必要とする経済情報が違う。

だからね、とりあえず自分の目的自体はっきりさせて、それに対して役立つ情報を「数」とか関係なく収集しようと思うんだよね、話はそれからってもんよ。

あと、Googleも極力使わない。DuckDuckGoへ変更する。Google Drive、GmailなどはProtonへ移行。

最悪、DuckDuckGo 自体が信用できないってなら、自分専用に情報収集するクローラをローカルサーバーで起動させる。それぐらいしなきゃやっぱダメよ。まあもっと簡単にやるならRSSリーダーかな。

本当のことを言うと、支配者層がコンテンツ市場を支配しているのが気に入らん。あいつらの性癖で高評価されたコンテンツを俺が好むとでも？笑止千万である。

Permalink | 記事への反応(0) | 00:24

多方面に迷惑かけやがってエンジニアのゴミクズが

Permalink | 記事への反応(2) | 15:36

2022-08-01

■

「いかがでしたか？」問題に「欲しい情報が出ない」問題…　Google検索の第一人者が語る、検索で不満が募る“意外な理由”とは | 文春オンライン

https://bunshun.jp/articles/-/56122

辻氏の記事に対するコメントにこんなものがあった。

blanqui 2022/08/01 12:51
Google検索の第一人者って何ぞって思って読んだら、クローラ作成者とか自然言語解析やアルゴリズムの研究者とかではなく、SEO 業者だった。
https://b.hatena.ne.jp/entry/4723202290562822882/comment/blanqui

WEB屋というか技術屋が多かったはずのはてなにおいて、「SEO 業者」の一言で唾棄するコメントにスターが集まってるのを見て悲しくなったわ。まぁ「Google検索の第一人者」という言葉が適切かどうかはともかく。

なんではてなって意地でも何かにイチャモンを付けたがる偏屈ジジイの巣窟になっちゃったんだろうな。何も知らんくせに偉そうなことをいう奴だらけ。ヤフコメレベルのネットスラムになってしまって俺は悲しいよ。

Permalink | 記事への反応(0) | 17:05

2022-03-06

■anond:20220306023518

あーゴメン。例が悪かった。

じゃあキミ自身が運営するサイト（できれば独自ドメイン）でテストしてみてくれ。

以前なら公開した瞬間にクローラがやってきて全てのページがインデックスされていた。

今ではクローラもなかなかやってこないし、やってきても全てがインデックスされるとは限らない。

かなり力を入れて書いたコンテンツでもなぜかインデックスすらされないこともあって、基準が謎すぎる。

Permalink | 記事への反応(1) | 13:11

2022-02-21

■anond:20220221191730

単にドメインだけじゃなくて、サイトの名前や内容（本文）もインデックスされて検索結果に表示されてんのよ。

Apacheのログ見てもクローラが来た形跡がないのに、どうやって？？？って話。

Google クローラしか来たログないのよ。

Permalink | 記事への反応(0) | 19:55

■Google検索は死んで…いないのでは？

Google検索死んでる→からの、まとも検索というオルタナギャグがブクマ集めている。

「Google検索は死んでいる」がバズったので「まとも検索」を作った。：村上福之の「ネットとケータイと俺様」：オルタナティブ・ブログ

で、思ったんだけど、YahooJも裏側はGoogleだから無視するとして、他にGoogleの代わりにできそうなエンジンってBingとかDuckDuckGoあたりだよね。

この二つって、本当に独自クローラーで集めてるのかな？　実は裏側はGoogleの検索結果を使ってるような気がしないでもない。

というのも、最近、俺が作った某サイト（独自ドメイン）があるんだけども、これはまだどこからもリンクされてない。つまり自分以外は誰も知らない状態。

で、Googleのサーチコンソールにだけは登録した。数日後にGoogleのクローラが来た。そんでインデックスされた。

ここまでは想定通り。

この段階では検索エンジンが異なるBingやDuckDuckGo等で検索しても当然結果には出てこない…と思ったのだが、試しにサイト名で検索してみたらなぜか結果に出る。

なんで？？？？？？

アクセスログを見てみても、自分のアクセスとGoogle クローラのアクセスしか記録されてない。Bing ボットやDuckDuckGoのクローラは来ていない。

自分が使っているブラウザ（Chrome）にはDuckDuckGoなどの拡張機能も入れていない。

つまり、BingやDuckDuckGoには「俺が作ったばかりの某サイト（独自ドメイン）」の情報はまだ一切ないはずなのに、検索したら表示されるという状態。

これって、Googleの検索結果を利用しないと不可能な芸当だと思うのだが…？

なんでこんな現象が起こってるんだろう？

詳しい人いたら教えて。

Permalink | 記事への反応(2) | 19:12

2021-11-25

■

ある1ページだけAccept-Encodingにbrを指定しないと応答が空になるのは何故だ

クローラ避けなら1ページだけやったって意味ないだろ

何のバグ？

Permalink | 記事への反応(0) | 07:23

2021-07-09

■anond:20210709214950

ヒエッ、本職きたよ。ヌボボ

ちなみに医学部にいった友人の何人がむしろ テック系に流れてきているという事情がある。

そこんとこ詳しく。メタップスとか？

東大卒だったら、言葉を正しく使え！

Waf なんて書くな！ WAF とかけ！

Pub/Sub とか

うっせーな。クラウドベンダーの独自 API なんか使いたくねーんだよ。オラクルじゃあるまいし。

DCL、DML、DDLといった用語を知っていることをひけらかしたかったのかもしれない

まぁ、それは認める。でもさ、select や create とかのDML/DDL は CRUD と同じだけと、DCL なんて権限を発行できるりょういきにトーシロを突っ込むわけにいかないだろ。何も考えずに GRANT TO なんてプロダクション環境で発行されて日には、権限消失されたら永遠にデータにアクセスできなくなるかもよ？

現場に放り込まれても１０年ぐらいかかる。というより、フロント からバックから低レイヤ から、モバイルまでやることはもはや現実的ではない。

そりゃそうだけど、フロントエンドは移り変わりが激しいじゃないですか。ほんの数年前までは Flash と DoJa のアプリを作ることがフロントエンド開発者でしたよ？一方データベースや OS の方は、ここ三十年ぐらい Unix と RDB が鉄板だった書ないすか。低レイヤだっていうけど、IoT なんかで C言語開発者はバリバリっすよ。例えば、クラウドフレアなんか CDN の再発明をしてますけど、サーバーラックを見る限りだと差がついているのは低レイヤの根本技術の改善であって、私はそこにプロフェッショナル性を見出しますがね。

C言語ができないのに「おそらく QUIC か MQTT 」とか分かってない英単語４文字を羅列するのは厨ニ病すぎます。

わかっていないのはテメーの方だ。今日オーバーフロー問題を抱えている C/C++ でサーバーの開発をしようとするのが危険なのは承知しろよ。パフォーマンスを必要とするなら Rust、または GC があるけど Go 言語を使って実装すべきだろ。高学歴なのは結構だけどは、現実は見えてないのか？いい加減にしろ。

片手間でできません。インフラ エンジニアに触らせます。

そうだね～。卓越したインフラエンジニアがすぐに手に入るなら、問題ないだろうけどさ、ベンチャーや硬直化した雇用形態の我が国で有能なインフラエンジニアをすぐに採用できるかよ。何年前の知識で戦っているの？時代は DevOps なんですよ。必要とあらば、すぐ学んで、応用して、デプロイできるのに「インフラエンジニアを採用から始める」なんて、ヨーロッパが衰退する理由もよくわかるよ。プププ。

Next でSSRまで踏み込むと結構

誰が Next で SSR なんてするか！あれは SEO が必要な場合に限る。そもそも SSR なんて危険だからまともなエンジニアだったらしないだろ。問題になってないだけで、本当のブラウザとクローラが見える内容が違うなんてスパム認定されてもおかしくないんだ。クローラにインデックスされるページで SPA をやろうとするやつはセンスないで。

MyISAM をInnoDBに切り替えるなんてことしているところは無い。万にひとつあったとしても、大事で、それだけで数ヶ月のものなので、この付け焼き刃の知識の人が触る機会はない。

すいませんでした。本当にすいません。

Kafkaを触ったとかいているが、Kafkaはサーバで使ったのかな？どういう利用シーンかというと膨大なログの収集等で使うのだが（ただのNoSQLではない）、Zookkeeperで調停させて、topic数とか調整するんだけど、わかってます？

ん？ AWS SQS だとパフォーマンスに問題があることしたいから Kafka を使いたいのよ。確かに Zookeeper のことは詳しくないよ。だけど、AWS MSK 使うんで。PaaS というもんがあるので、だめなん？ログ収集は GKE みたいにログに出したら Fluentd で収集してくれる時代になんでグチグチ言われないといけないの？