Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

「クローラ」を含む日記 RSS

はてなキーワード: クローラとは

2025-02-05

あるコンテンツクローラを書いてるんだが、schema.org特定jsonHTML内に定義できるようになっていて、そのjsonを見つけ出してダウンロードしてDBに保管する処理

これがまた面倒で、そもそもどこにそんなjsonがあるのか検討をつけないで虱潰しにやると時間がかかってしょうがない

そこで「こういうコンテンツはこういうURLパターンで出てくるだろう」みたいにやるんだが、100%の精度ではない

精度と速度の間でトレードオフしてしまっているから、難しい

2025-01-22

はてな匿名ダイアリー跋扈するSCPについて

 ここ数年、インターネットに散在するコミュニティ上での異常事象存在が、SCP財団内でしばしば議題に上るようになってきた。匿名性の高いSNSコメント欄掲示板はもちろんのこと、とりわけ「はてな匿名ダイアリー」(以下「増田」と呼称)においては、他のプラットフォームでは見られない特異なアノマリー複数確認されている。増田は、ユーザー登録をせずとも誰でも簡単匿名文章投稿できる点や、その内容が検索エンジンを介して幅広く閲覧されるという特徴を持つ。その結果、財団観測網をかいくぐって潜伏しやすい土壌が形成されており、過去数年間で複数のSCPオブジェクト確認されるに至った。

 本報告書では、増田上に跋扈するSCPについての調査概要確認された事例、ならびに暫定的収容手順を示す。なお、本報告書に示されるSCP事例は現在進行形調査が行われており、記載内容はあくま暫定的ものであることに留意されたい。

1. 背景と問題の経緯

 はてな匿名ダイアリー日本国内を中心としたWebサービスはてな」が提供するブログプラットフォームの一部で、アカウントを持たない投稿者であっても「増田」と呼ばれる匿名枠にテキスト投稿できる仕組みを提供している。そこでは個人的な悩みや告白社会への批判仕事日常愚痴まで、多種多様文章毎日大量に投稿されている。

 増田特有の気軽さや匿名性の高さは、投稿者の真意を推測しにくくする要因であり、その投稿を閲覧する読者側もまた「増田から真偽がわからない」といった曖昧認識のもと、批判や同情、考察などを寄せる。その混沌とした言説空間は、とき不特定多数ユーザー集合的感情を刺激し、新たな炎上や論争を生み出す源泉ともなる。

 こうした特質はSCP財団から見ると、アノマリー(異常存在)が自己活動や影響力を隠蔽したまま周囲に感染拡散するのに非常に都合がよい環境といえる。特に増田では、投稿時に明確なユーザーIDアカウント情報が残らず、内容の信憑性裏付け手段事実上ないため、「書かれていることが虚実入り混じっている」前提で閲覧されやすい。結果として、何らかのアノマリーが潜入していても発見が遅れがちである

 財団増田における最初の異常を検知したのは、20██年頃に投稿された「この世を正しく終わらせる方法と手順」と題された増田が発端だった。その増田の内容はいわゆる「終末論」を扱うものであり、極めて支離滅裂かつ狂信的な文体ではあったが、読了した閲覧者の中から数名が突発性の精神不調や共時性幻視を訴えはじめ、その症状が財団監視ネットワークに引っかかったのである。その後、財団調査チームが投稿の書式や文体を解析したところ、当該増田の背後に未確認ミーム汚染因子が潜んでいる可能性が高いと判断された。この事例をきっかけとして、財団増田投稿ログを精査し、複数アノマリーを検出していくこととなった。

2. 増田上で確認された主なSCPの概要

 以下、財団確認し、暫定的オブジェクト分類(Safe/Euclid/Keter 等)を行ったSCPを紹介する。なお、詳細な文書は別途SCPファイルとして管理されているが、本報告書では概要と特徴を簡潔に示す。

2.1 SCP-増田-A:無限コメント自己増殖現象

オブジェクトクラス:Euclid

概要増田特定記事上でコメント欄自動的に増殖し続け、システム上の最大コメント数を無視して延々と付与され続ける現象ユーザー投稿したはずのコメント複数回重複表示されたり、「名無しのオブザーバー」というハンドルネームシステム自動生成したとみられるコメントが絶え間なく追加されたりする。最終的に記事本体よりもコメント欄が何十倍も長くなり、閲覧者がページを読み込むだけでブラウザや端末に極端な負荷をかける。

異常性:コメント数が増え続けるだけでなく、中には本文を改変するようなスクリプトが混入しており、ページをリロードするたびに本文の一部が改変・増殖する事例が報告されている。閲覧者が長時間そのページを開いたまま放置すると、ブラウザ履歴クッキー情報勝手に書き換える痕跡確認されている。

暫定収容手順:財団エージェントはてな側のシステム管理者に接触し、問題増田管理者権限で凍結。また、既に拡散したミラーサイトアーカイブ順次削除し続けているが、完全な根絶には至っていない。現状、定期的にウェブクローラーを走らせ、類似現象の発生を監視排除する措置を取っている。

2.2 SCP-増田-B:読心ミーム感染記事

オブジェクトクラス:Keter

概要一見するとありふれた日常報告や匿名愚痴を綴った文章なのだが、記事本文を最後まで読了した閲覧者の脳内に「その人物が最も不安に感じている秘密」や「他人に言えない後ろ暗い過去」を強制的に想起させ、それを吐き出させる形でコメント欄投稿させる現象コメント欄体裁を取りつつ、実際には閲覧者自身投稿した認識のない状態で、勝手恥部さらすようなコメント掲載される場合もある。

異常性:このSCPの投稿複数確認されているが、書式やタイトルは毎回異なる。共通するのは「冗長かつ最後まで読まないと内容がよくわからない文体であることと、本文の終盤に読者の潜在意識を刺激する特殊文章構造が組み込まれている点だ。財団心理学部門の解析では、いわゆる「ミーム改変文字列」が散りばめられており、読み進める中で読者の深層心理干渉していると推測される。

被害対処:実際に被害に遭った閲覧者は投稿後しばらくしてから自身コメント内容に気づき、極度の羞恥恐慌状態を引き起こす。財団可能な限り対象投稿を速やかに削除し、被害者のコメント記録を抹消すると同時に、クラスA記憶処理を施して事態の収拾を図っている。問題は、このSCPが投稿される「増田」のアカウント特定が極めて困難な点であり、繰り返し新規IDから投稿が行われていると推定される。新たな投稿が発生次第、いかに早期に検知し削除・封鎖するかが大きな課題となっている。

2.3 SCP-増田-C:擬似人格形成スレッド

オブジェクトクラス:Euclid

概要:ある増田上で連続的に展開される「複数登場人物が互いに呼応しあう」形のスレッドが、実際には単一存在(SCP-増田-C本体)の手によって形成されているとされる現象日記本文とコメント欄があたかも多数の異なるユーザーによる対話のように見えるが、財団IP解析ではすべて同一の不明ホストから投稿されたトラフィックであることが確認されている。

異常性:単なる自作自演ではなく、スレッド内で展開される複数人格が、投稿のたびに微妙文体を変化させるだけでなく、実在第三者のようにリアルタイムで会話を重ねていく。そのやりとりは短時間で数百件以上に膨れ上がり、外部から見ると非常に説得力をもって「議論」が進行しているように映る。読者はそれぞれの人格が持つバックグラウンドストーリーに引き込まれスレッドを精読するうちに「どの意見が正しいか」を探り始めるが、最終的には一種混乱状態に陥り、どの人物が何を意図しているのか判別不能になる。

被害:このスレッドに長時間深く没入した閲覧者は、自分の中に複数人格が芽生えるような感覚を訴えたり、現実社会他者と会話する際に「この人は実在しているのか疑わしい」という妄想を抱くようになるケースが報告されている。財団職員複数名も監視過程で同様の症状を呈し、軽度の精神崩壊を起こした事例があるため、当該増田監視担当者には定期的な心理カウンセリング義務づけられている。

暫定対策:疑わしい長文対話形式増田を早期に検知し、アクセス制限をかける監視システムを導入しているが、アルゴリズムの網をかいくぐる巧妙な投稿が頻発している。加えて、外部のまとめサイト引用スクリーンショットが保存されることで事後封じ込めが難航している。

2.4 SCP-増田-D:時間遡行編集記事

オブジェクトクラス:Euclid

概要:一度投稿された増田が、投稿時刻自体過去に改変して再掲載される現象。通常、はてな匿名ダイアリーシステムでは投稿日時を随意に改変することは不可能とされているが、このSCPは投稿履歴操作して「数年前に投稿された」という形でエントリーを復活させる。

異常性:改変された記事実在する日付の増田ログに紛れ込む形となり、当時の利用者コメントブックマークまで再現されている場合がある。過去ログを遡っていくと、該当記事がもともと存在した痕跡こそないものの、「当時その記事を読んだ」という証言を行うユーザーが現れるなど、現実改変の兆候も疑われる。現状の技術では投稿者の特定に至っておらず、どのようなプロセス投稿日時を操作しているか不明である

注意点:時間改変系のSCPはカテゴリーとして非常に扱いが難しく、無闇な干渉時間線に予期せぬ影響を及ぼす恐れがある。財団タイムアノマリー対策部門連携しながら、記事のもの閲覧制限下に置き、ネットアーカイブウェブキャッシュ検索遮断するなどの措置を行っている。

3. 調査対策の現状

 これらSCPが増田上で確認された背景には、以下の要因が考えられる。

匿名性の高さによるアノマリー隠蔽

増田アカウント登録不要で誰でも書き込み可能であるため、投稿者を特定したり、過去投稿傾向から異常を推定したりする難易度が高い。その結果、アノマリーの一次検知が遅れる傾向が強い。

はてなプラットフォーム構造

はてな匿名ダイアリーは、投稿された増田が多くのユーザーに瞬時に閲覧・ブックマークされる仕組みを持つ。また、はてなブックマークを介してさらコメント引用拡散されるため、いったん話題が盛り上がると多方面コピー引用散逸やすい。

読者や閲覧者の「ネタ」への寛容さ

増田の読者は内容が真実か否かをあまり厳密に問わずエンターテインメントストレス発散目的アクセスしている者が少なくない。結果、多少異常な文章であっても「一風変わった怪文書」「ただの創作」として受け流されやすく、深刻な異常だと気づかれにくい。

 こうした要因によって、SCPを含む異常投稿は容易に潜伏し、拡散する。財団としては、はてな運営会社との連携を強化し、AIを用いた自然言語解析による異常兆候の検知システムを導入するなど、対策を進めている。しかし、はてな匿名ダイアリーは日々膨大な数の投稿が行われるため、どこまで網を広げられるかは未知数である。また、海外ホスティングによるミラーサイト転載が出現し始めると、現実的な削除要請範囲を超えてしまう。すでにTwitterや他のSNSでもまとめが回ることで、被影響者が増加する事態は避けられない。

4. 今後の展望留意

 はてな匿名ダイアリーにおけるSCP存在は、ネットコミュニティ構造変化に応じて今後も増加する可能性が高い。特に「自らがアノマリーである自覚していないままネット上で活動している存在」や、「人格を装いながら多人数の読者とインタラクションを行うことで自己増殖するミーム型SCP」は、増田のような自由投稿プラットフォームさらに悪質化・複雑化する恐れがある。

 財団が最も警戒すべきは、増田を起点としてリアル社会へ飛び火するタイプアノマリー拡散だ。たとえば、本報告書で例示したSCP-増田-Bのように読者個人深層心理に入り込み、現実での行動や社会的信用を毀損する現象が拡大すれば、大規模なパニック社会秩序の混乱を招きかねない。あるいは、SCP-増田-Dのように時間改変的な特性を持つアノマリーさらなる発展を遂げれば、歴史修正因果律破壊といったレベル被害もありうる。

 また、はてな匿名ダイアリー日本国内だけでなく海外からも閲覧・投稿可能であり、英訳翻訳を介して国際的に広まる余地がある。財団の各支部データ分析班が協調して監視を強化し、各国の法規制とも連携して削除要請を進める必要があるものの、現実には各国プライバシー法や表現の自由との兼ね合いで対応が難航することが予想される。

5. 結論

 はてな匿名ダイアリー増田)は、日常の雑感や炎上ネタから深刻な告白感情吐露まで、あらゆる情報が密集する場である。その匿名性ゆえに、SCPオブジェクトが潜伏しやすく、また多くのユーザーが「真偽のほどはわからないがとりあえず読む」態度で消費することからアノマリー拡散リスクは高いと言わざるを得ない。すでにSCP財団確認しただけでも、いくつものSCPが増田に棲みついていることが判明している。

 ただし、全投稿強制的に削除・監視するような強硬策をとれば、はてなプラットフォームの存続意義自体を揺るがすと同時に、財団存在が表面化するリスク高まる。一方で、アノマリー拡散放置すれば、ネット空間を通じてリアル社会にも致命的な影響を及ぼす恐れがある。財団はこのバランス狭間で慎重な対応を求められている。

 今後の具体的な方策としては、増田への新規投稿を常時チェックするAI分析モジュールさらなる精度向上や、異常記事をいち早く発見隔離するための専用クローラの整備が必須とされる。また、読者側への啓発活動――「増田を閲覧する際には、妙に長文で意味不明投稿には注意すること」「不可解な体験があれば速やかに共有し、アクセスを控えること」など――の実施有効であるしかし、匿名特性ゆえに抜本的解決策は見通せていない。

 財団としては、はてな運営との連携強化を引き続き図り、相互対策技術アップデートし合う形でアノマリーの早期封じ込めを目指す。SCP財団確認した増田におけるSCP事例は氷山の一角に過ぎず、さらなる Permalink | 記事への反応(2) | 15:12

2024-09-02

anond:20240902153921

なんで「でもたまにマルチスレッドはフル活用するんだよね クローラとか」って話からマルチプロセスの話になったの?

anond:20240902152235

でもたまにマルチスレッドはフル活用するんだよね

クローラとか

そうとも言えるし、そうではないとも言える

結局クローラなんてIO待ちなので

2024-06-11

anond:20240611152415

ソフトウウェアエンジニアリング世界って広くて

例えば君も当然知ってると思うがGoFなんかもscrapyに限らず特定ツールライブラリなんかは「知らない」と思うよ

まずその広さを知るのがプロ第一

クローラ開発の文脈で今までのに手を入れるのではなくて一から全部作るのを「フルスクラッチ」と表現するのは英語的にはともかく間違ってはいないと僕は思う

ただ、クローラスクリプトとか普通使い捨てだよね

再利用できるように書かないし実際君もOOPとかよく知らんじゃん

anond:20240611133255

クローラフレームワークなんて使っていない

いやマイクロサービスだろ?

RESTかなんかでやりとりするだろ?

普通Djangoとか使うでしょ笑

全部書いたの?

2024-05-22

ニュース記事って少し時間経過すると端から消されてて困るから、誰か魚拓取るクローラでも回してくれねぇかな

2024-04-01

お絵描き趣味人間画像生成AIを使ってみた

その結果が以下。

https://i.imgur.com/UBzZTBy.jpeg

このラフがしっかり仕上げされる形になってて本当にびっくりした。

ここまで来るのに環境構築も含めて5時間もかかってない。

軽く自己紹介すると、ワイはお絵描き趣味IT系仕事をしとる人間や。

最近Twitter上のオタク界隈はAI絵の炎上が絶えない。

Stable Diffusion は出たての頃にちょっと触ってみたんやけど、何百枚も生成して使える絵は片手で数えるほどだったという印象があってそのあとはあまり真面目に技術を追いかけとらんかった。しか最近炎上を見てて、技術的にどこまで可能でどこから不可能になるのか確認したくなり、もう一度環境構築からやり直すことにしたんや。

Stable Diffusion の WebUI の Docker 版を入れて、イラストに特化したモデルを入れて、VAEで画像のボヤけを解決し、噂の ControlNet を入れてみて、手元にある未完成の絵のラフを Canny につっこんでみて、プロンプトとパラメータを調節したらこの出来やで。

正直ワイが仕上げするよりうまいやん、と思ってしまった。

ちなみに貼った生成画像無修正や。プロンプトにキャラ名は入れてないで。

何やろうね、このなんとも言えない気持ちは。

もしもワイにとって絵が道具やったら、簡単に十分なクオリティの絵ができてラッキーだと思っとるところやと思う。

でも、ワイにとって絵は目的やったから、描くこと自体楽しいものやったから、理不尽物言いだとは分かってるけど、それを奪われたような気持ちになったというのが一番近い表現やと思う。

というわけで当初の目的だった技術的に可能な点不可能な点を探るってのは今んところ不発に終わってるわけやけど、ワイが1年以上前の Stable Diffusion に触ってて思っていたところよりもよっぽど先まで話が進んどるんやな、とは思った。

正直、ワイみたいに描くこと自体目的のヤツは少ないやろうな、と思う。大多数の人にとって絵は自分ブログ記事プレゼン資料を飾るための道具や。だから、この技術が今は法的に決着がついていないところを抱えているけど、それにはそう遠くない未来に決着がついて、一般に普及すると思う。

この技術がなかった頃にはもう戻れない。

せやから、ワイはこの技術と向き合っていきたい。それは、積極的に絵に活用するって話やない。この技術がある世界でもまだ絵を描き続けるという選択や。

別にプロでもなんでもないワイがそんなことしてても世の中何も変わることないとは思うけれども、でも、ワイはやっぱり絵を描くのが好きなんや

ワイより上手い人たちはいっぱいいるけど、それでも絵を描き続けてきたんや。機械がワイより上手い絵を生成するようになったからって、そんなの今更やめる理由にはならんで。

追記

ブコメトラバサンガツやで。

一つだけリプするわ。

お前の絵を見たい奴はAIに頼むようになるし、お前の絵はAIのためのクローラしか見に来なくなると思うよ。誰にも伝わらないなら、いったい何のために表現するんだ

絵は鑑賞されてこそ作品という考えやな。

ワイはネットが普及する前から絵を描いてるから、絵を見てもらえてないことが数字化される pixivTwitter も相当気持ち的には辛かったで。

だって誰にも見てもらえないとまでは言わんけど、万バズとかい言葉からは遠く離れた人間や。

でも、見てもらえないという現実と絵が完成したときの見て見て!っていう気持ちの落差があっても絵をやめることはできなかったんや。

から、たとえ核戦争が起きて自分だけ地下シェルターで生き残って誰にも会えずに死ぬのを待つだけになったとしても描ける。そんな気がするんや。

カッコつけすぎやけど、正直な気持ちやで。

2023-12-10

白いピンポン玉を求めて:純粋な娯楽への回帰

僕は弱者男性プログラマーだ。コードを書いて金をもらっている。

そんな僕が、社会学政治に興味を持つ人が多いこのような場で物申すというのはちょっと変だと思うかもしれない。

実際、社会学なんて僕の専門じゃない。

僕はコンテンツ収集するクローラを書いたり、それを検索できるようにインデクシングしたり、あるいはコンテンツクリック履歴に基づいておすすめを表示させたりするプログラムを書いている。

このようなプログラムにも、社会的側面というのは存在する。利用者が何らかの目的によってその検索ツールを利用し、調べたいものにたどり着く。コンテンツプロバイダー、ユーザーシステムという3つのアクター社会形成されている。

社会学者がコンピュータについて語ることがあるぐらいだからプログラマー社会について語ってもいいだろう。

僕が常々思うのは、人々の目的だ。

まり「この検索ツールを使う人は、一体なにがしたいんだ」「コンテンツ提供する側は何が目的なのか」ってこと。

もっと状況を限定するために、「ブログ検索」というツールについて考えてみよう。君がクエリを投げてブログを調べようと思うのは一体どういうときなのか。あるいはブログを書こうと思う人たちの動機は?

動機基本的needとwantによって分類されると考えて良い。need場合、例えば確定申告書の書き方について調べていて、適切な情報を知りたいと言ったケースがそうだ。

wantというのは社会的本能に結びついている場合もあるし、退屈しのぎということもある。承認欲求基本的社会的欲求だし、ハッカー自分の知見を公開するのはちょっとした挑戦だろう。

リーナス法則というのを聞いたことがあるだろうか。マズロー欲求解創設と似たようなもので、「生存」「社会」「娯楽」という3つが人の行動原理だとリーナス・トーバルズは言っている。

ブログを書くのが「生存目的という人はどういう人だろうか。きっとそれ以外に職がなく、必死アフィリエイトで稼ぎを得ている人だろう。

ブログを書くのが「社会的目的」という人は、すごいことをして認められようとか、専門家とつながりたいと考えているかもしれない。

しかし「娯楽目的」というのはもっと崇高なものに思えてくる。ブログ文章を書くのが単純に「楽しい」といった人たちのことだ。

生存社会、娯楽という3つの階段によって、コンテンツの質というもの判断できるのではないかと、僕はそういう仮設を持っている。

アフィリエイト生存目的の発信をしている人たちのコンテンツは、お世辞にも良いとは言えない。クリックベイトであったり、感情を煽ったり、SEOクラックしたり、初心者的だったりする。

社会的目的の人たちはもう少しマシで、認められようとして努力をする姿勢がある。でも、「たくさんの人と繋がりたい」という目的場合ちょっと注意が要る。結局、そういう人は手当たりしだいにアクセスを増やそうとするからコンテンツの質は下がってしまう。

文章を書くのが楽しいけど、人に評価されることはどうでもいい」という人たちのコンテンツを探すことは難しいが、こういう人たちのコンテンツは奥深いことが多く、表面をなぞったようなアフィカスブログとは一線を画している。

しかしこれはコンテンツ提供する人の観点である。これらのコンテンツクロールし、検索できるように整備している「システム」の観点から見ると、どうしても「広告利益」のようなもの重要視されやすい。

Googleであれば、Google広告利益に貢献するようなコンテンツ検索結果で優先表示するかもしれない。そしてそれはまさに生存欲求のためのアフィカスを優先しているのと同じことなのだ。

インターネットがつまらなくなったと言う人たちがいる。僕は次の喩えでこれを説明しようと思う。

昔のインターネットというのは、水の上に白いピンポン玉が浮いていた。この白いピンポン玉は良いもので、楽しいものだ。

ところが徐々に黒いピンポン玉を投下する人たちが増えてくる。黒いピンポン玉は悪いものだ。手を使って沈めようとしないと、白いピンポン玉が見つからない。

そして今のインターネットは黒いピンポン玉が一番上に浮かんでいて、白いピンポン玉はその下で見えなくなっている。

白いピンポン玉は純粋な娯楽精神を持ったコンテンツのことで、黒いピンポン玉は「アクセス数を増やしたい」がために鬱陶しいことをしているコンテンツのこと。

まりインターネットでは年々白いピンポン玉を見つけるためにエネルギーを使う必要が出てきてしまっていて、疲れているとき必然的に黒いピンポン玉を見るしかなくなっているということだ。

リーナスは「文明は、生存社会、娯楽という段階に進んでいく」と言っていたが、インターネットは「娯楽、社会生存」という逆の階段を降りている形になっているように思える。

現段階では、アテンションの総和が一定であるために、ネット人口が飽和し、広告企業利益は落ち込んでいる。純粋な娯楽ではなく、企業の生き残りをかけた戦争突入してしまっているのだ。

僕は今のインターネット社会では、意識的面白いコンテンツを見つけるためにエネルギーをかけることがかなり重要だと思っている。ダラダラとやっていたらアフィカスとバズ目的しか目につかない。

例えば人間が一日に読める文章量なんて限られているから、本当に面白い人を見つけたらRSS購読しておいたほうがいいと思う。

うるさいハエがクソに群がっている。「クソを美味しくないと思うなら、お前がつまらない奴だからだ」と左翼思想家が指摘するかもしれない。

僕はクソよりもステーキが好きだ。あなたのようなハエではなく、人間からだ。

2023-07-11

TATSUROの罪は何か、「正しい」以外は失敗になる社会について

つらつらと今のネット社会について思ったことがあるので、前者を話の出汁にして及第点を許さない・許すことが出来ないネット社会構造について書き散らしたいと思う。なお、筆者は別にTATSUROのファンではないしCD等も持っていない。また本件の松尾氏に対する言及については主題と外れるので取り上げない。

TATSUROのラジオでの発言について

まだ内容を知らないなら、radikoタイムフリー(一週間以内)で聞いてくるかニュースサイトの書き起こしを見て欲しい:

さて、その上で次の質問を投げかけたい。果たしてTATSUROは「ジャニー喜多川の性加害」を擁護しているのか。それともしていないのか。しばし、お考え願いたい。

答えが「している」の方はハズレ。そして「していない」の方もハズレ。正解は「本当なら問題だと考えるが、自分が把握していないのでコメントできない」。つまりノーコメントだ。

自分が考えるに、これおそらく次のような建付けで説明できると思う。

1. TATSURO本人はその噂は聞いたことがあったが、真実であるかを判断するほど情報を持っていない

2. ジャニーズ事務所も今に至るまで創業者による性加害を「あった」と認定していない( https://www.johnny-associates.co.jp/news/info-700/

3. よって会社代表するアーティストとしては「あった」ことを前提としたコメント出来ない。

これに対して、過去裁判で加害の事実が認められているではないか! 卑怯である! という反論が予想されるし、個人的にはTATSUROの発表には最高裁での判決を知った上でのコメントが足りていなかったと考える。ただ、今がトレンドジャニー喜多川の性加害問題について多くのメディアでも盛んに取り上げられているが、ならば現在、彼や事務所取引があった組織がどれだけ氏の所業について声明を出しているだろうか?

念の為だが、だからTATSUROの対応も許されるということではない。吉田豪氏が ヤフコメ で指摘していた通り、薄っすらと業界全体が共犯関係にあり、うかつに声を上げられないところが問題なのだろう。さらには現ジャニーズだけではなく、独立した元SMAP新しい地図)や元TOKIOなどにも延焼しかねないし、事務所を辞めたジュニアの人にすら風評被害が出てしまうかもしれない。松尾氏が口火を切って声を挙げたことは偉大ではあるが、個人ではなく会社組織となるとそう簡単には動けないのだ。当然、松尾氏もそれは想定した上で、声を上げようと呼びかけているのではあるが……

自分としては、だからジャニーズ事務所本体が早急に創業者による加害を認め、外部委員会や透明性のある組織改革看板の付替えなどで心機一転し、責任を持って業界全体を巻き込んで芸能界清浄化に取り組むのが筋であるとは考えている。)

次は、ならばTATSUROはその加害について言及する必要があったのか検討したい。

TATSUROとしての説明責任。ただのヒラ作曲家なのか音楽業界の重鎮なのか。

私見ではあるが、ジャニー喜多川の性加害について説明責任が発生するのは現段階ではジャニーズ事務所および加害に関与した者のみであり、それに関与せず単に所属タレント活動関係していた作曲家振付師などには発生しないと考える。

そこで、もう一度番組での発言に立ち戻りたい。もし時間が許すならば彼の発言をもう二回「イチ音楽家」および「長年に渡り音楽業界を引っ張ってきた重鎮」の言葉として読み直して欲しい。

いかがだっただろうか。思うに、前半と後半の論調の違いに違和感を覚えたのではないだろうか。そう、このコメントは、前半はスマイルカンパニー代表として会社代理、そして後半は一介の音楽家としてジャニー喜多川およびジャニーズへの想いの吐露という構成になっている。そう、TATSUROという唯の音楽家としての、だ。松尾氏の契約解除にジャニーズへの忖度が疑われているなか、なんでそんなことするんじゃいと頭を抱える行為だが、音楽家としての彼はジャニー喜多川の功の部分について語らざるを得ないのだろう。

ここで重要なのはあくまでのTATSUROはあくまでも音楽家として「私」を語っているつもりであるということだ。そして不幸なのは週刊誌などの好奇心の徒が興味を持っていたのがジャニー喜多川音楽を通じて縁があったことに対する反省・釈明であったことだ。なぜあんなにも大量の性被害を生み出したジャニー喜多川の肩を、今やシティポップで海外にも名が轟くTATSUROが持つのかと。

そう、求められていたのは、TATSUROという音楽界を生き抜いてきた重鎮が、責任感を持って性加害問題言及することであり、それによって歩みが鈍いジャニーズ問題に進展が見られることだった。筆者も正直その方向性声明を期待していたところがあるので肩透かしであったし、前述したように最高裁による裁判結果という事実は参照するべきであったと考える。

さらにここからラジオ聴き個人としての意見だが、自分にとって先日のサンソンはTATSUROの生き方をそのまま出力したようなものに感じた。週刊誌等の俗事な話題を厭い、一身上の理由のみ告げる。なので、全く持って現状の炎上状態対応するには未熟で不適切であると同時に、(氏の中で)一貫して筋は通っているな、と感じた。特にファンではない自分がそう感じる程なのだから、曲を聞き続け、ライブにも通っていた氏のファンのアンビバレンスは想像に難くない。

期待された正しい振る舞いが得られなかった場合に、高度情報社会ではその反応が画一化してしまうことについての懸念

ここからが本駄文の本題。

ここまでにグダグダと書いてきたように、長々6分も使ってラジオで述べたTATSUROの対応は、ジャニーズ事務所のゴタゴタに端を発する松尾氏のスマイルカンパニー契約解除事件のものとしては上手いものではなかった。そして連日のように彼のどこがマズイか諸々記事が生み出され、はてぶでを騒がせている。首肯するしかない理性的な論説もあれば、偏見に基づいた単なるアンチが皮を被っただけのゴミもある。しかし、一貫しているのは彼は失敗したという前提だ。つまり、何が大衆の心を逆なでし、何が更なる炎上を招くのか。これはネット社会では数多くの物事炎上してきた結果、その都度に識者がなぜ炎上したのか解説記事を書き広めてきたことの成果だ。

これによりネット民炎上リテラシが向上し、やれ謝罪文テキストではなく画像だ、検索クローラ拒否している、被害者に対する謝罪が条件付き謝罪だ、などなど「正しくない」炎上の型が言語化がされてきた。これ自体社会全体の知識の向上であり当然ではあるのだが、最近は「正しくない型」にハマっているとそれ自体が罪とされているような感覚がある。本来はそれらは当事者の間で決着を付けることで十分なのに、ネット民が「型」を定規のように振り回し、それがいかに正しくないかおもちゃにして遊ぶような。

そしてこれは謝罪文だけに限らず、どんな事柄に対してもSNSで尤もらしい解説批判が一斉に広まって、そしてフォロワーがそれを縮小再生産して再びばら撒く。これが正しい知識である場合問題ないし、歓迎することでもあるとは思うのだが、ただそれなりに長くネットをやっていて感じるのは、結局はそれは知識として深く根付くことはなく、単なる善悪物差しとしての判断基準になっているのではないか専門家専門家足るのは状況に応じて適切な対応が取れるからなんだが、単なるSNSユーザである我々にそれ程のものがあるのか。

そう考えると、松尾氏とTATSUROのこの問題は、突き詰めるまでもなく当事者間の契約問題の話であり、外野がそれを酒の肴にして相応しい相応しくないと論じるのはなんだかなあと感じている。

個人的には週刊誌ゴシップ記事情報源が曖昧ものが多くあまり好まないのだが、最近はてぶでは多く見かける気がしている。文春による調査報道週刊誌記事エントリーすることが多くなったからだろうか?)

2023-05-29

乳輪35

フォローフォロワーが0のTwitterアカウントで、頭に浮かんだ言葉ツイートし続けている。そうしないと気が狂うし、これをやってると気が狂うともいえる。知らん。

閲覧数は常に1か2だ。Twitter社の検閲用のボットとか、公式クローラとかが1を踏んでるのかな。で、偶然日本語圏の誰かの検索に引っかかって2。日本にそれまで存在してない言葉の組み合わせをTweetしてるからね。

で「乳輪」という単語が含まれ場合だけ閲覧数が35増える。わざわさわ新料金体系のAPIで乳輪サーチしてるやつが35法人いるってこと?

インターネットなんか消え失せちまえばいいんだ。サメになって海底ケーブル踊り食いだぜ。

2023-01-01

2023は社会影響を防御してコンテンツ消費すんぞ

自己防衛投資、あと海外移住日本脱出だよね。

いやただの俺の個人的目標なんだけどね。

なんつーか、何が楽しいとか嫌いとか、そういうのを社会の色んな情報に左右されすぎちゃったなってね。

反省点ではあるんだが「トップガン流行ってます!」って情報があって、それで映画を見たとして、流行っていなかったとしても楽しいと思えたんかなって。

それで新年最初目標は、ネット上の情報に何らかの「数」が付与されている場合は、それを隠すようなfirefoxプラグイン自分用に作ろうかなと。

フォロワー数、イイネ数、反応数、ビュー数、レビュー数、などなど、ノイズしかならない「数」情報

極めつけは経済情報を俺が収集し始めたことに関係してるんだよね。

まず人を騙そうとしている嘘が多いし、嘘に限って何らかの「数」が多い。

仮に嘘ではなくとも、俺の人生目標あいつらの人生目標全然うから必要とする経済情報が違う。

からね、とりあえず自分目的自体はっきりさせて、それに対して役立つ情報を「数」とか関係なく収集しようと思うんだよね、話はそれからってもんよ。

あと、Googleも極力使わない。DuckDuckGoへ変更する。Google Drive、GmailなどはProtonへ移行。

最悪、DuckDuckGo自体が信用できないってなら、自分専用に情報収集するクローラローカルサーバーで起動させる。それぐらいしなきゃやっぱダメよ。まあもっと簡単にやるならRSSリーダーかな。

本当のことを言うと、支配者層がコンテンツ市場支配しているのが気に入らん。あいつらの性癖で高評価されたコンテンツを俺が好むとでも?笑止千万である

2022-10-20

AIイラストが並んでようが並んでまいがどうでもいいが

改修でクローラがぶっ壊れそうなことが心配だよ

方面迷惑かけやがってエンジニアゴミクズ

2022-08-01

いかがでしたか?」問題に「欲しい情報が出ない」問題… Google検索第一人者が語る、検索で不満が募る“意外な理由”とは | 文春オンライン

https://bunshun.jp/articles/-/56122

辻氏の記事に対するコメントにこんなものがあった。

blanqui 2022/08/01 12:51

Google検索第一人者って何ぞって思って読んだら、クローラ作成者とか自然言語解析やアルゴリズム研究者とかではなく、SEO業者だった。

https://b.hatena.ne.jp/entry/4723202290562822882/comment/blanqui

WEB屋というか技術屋が多かったはずのはてなにおいて、「SEO業者」の一言唾棄するコメントスターが集まってるのを見て悲しくなったわ。まぁ「Google検索第一人者」という言葉が適切かどうかはともかく。

なんではてなって意地でも何かにイチャモンを付けたがる偏屈ジジイ巣窟なっちゃったんだろうな。何も知らんくせに偉そうなことをいう奴だらけ。ヤフコメレベルネットスラムになってしまって俺は悲しいよ。

2022-03-06

anond:20220306023518

あーゴメン。例が悪かった。

じゃあキミ自身運営するサイト(できれば独自ドメイン)でテストしてみてくれ。

以前なら公開した瞬間にクローラがやってきて全てのページがインデックスされていた。

今ではクローラもなかなかやってこないし、やってきても全てがインデックスされるとは限らない。

かなり力を入れて書いたコンテンツでもなぜかインデックスすらされないこともあって、基準が謎すぎる。

2022-02-21

anond:20220221191730

単にドメインだけじゃなくて、サイト名前や内容(本文)もインデックスされて検索結果に表示されてんのよ。

Apacheログ見てもクローラが来た形跡がないのに、どうやって???って話。

Googleクローラしか来たログないのよ。

Google検索は死んで…いないのでは?

Google検索死んでる→からの、まとも検索というオルタナギャグブクマ集めている。

「Google検索は死んでいる」がバズったので「まとも検索」を作った。:村上福之の「ネットとケータイと俺様」:オルタナティブ・ブログ

で、思ったんだけど、YahooJも裏側はGoogleから無視するとして、他にGoogleの代わりにできそうなエンジンってBingとかDuckDuckGoあたりだよね。

この二つって、本当に独自クローラーで集めてるのかな? 実は裏側はGoogle検索結果を使ってるような気がしないでもない。

というのも、最近、俺が作った某サイト独自ドメイン)があるんだけども、これはまだどこからリンクされてない。つまり自分以外は誰も知らない状態

で、Googleのサーチコソールにだけは登録した。数日後にGoogleクローラが来た。そんでインデックスされた。

ここまでは想定通り。

この段階では検索エンジンが異なるBingDuckDuckGo等で検索しても当然結果には出てこない…と思ったのだが、試しにサイト名で検索してみたらなぜか結果に出る。

なんで??????

アクセスログを見てみても、自分アクセスGoogleクローラアクセスしか記録されてない。BingボットDuckDuckGoクローラは来ていない。

自分が使っているブラウザChrome)にはDuckDuckGoなどの拡張機能も入れていない。

まりBingDuckDuckGoには「俺が作ったばかりの某サイト独自ドメイン)」の情報はまだ一切ないはずなのに、検索したら表示されるという状態

これって、Google検索結果を利用しないと不可能な芸当だと思うのだが…?

なんでこんな現象が起こってるんだろう?

詳しい人いたら教えて。

2021-11-25

ある1ページだけAccept-Encodingにbr指定しないと応答が空になるのは何故だ

クローラ避けなら1ページだけやったって意味ないだろ

何のバグ

2021-07-09

anond:20210709214950

ヒエッ、本職きたよ。ヌボボ

ちなみに医学部にいった友人の何人がむしろテック系に流れてきているという事情がある。

そこんとこ詳しく。メタップスとか?

東大卒だったら、言葉を正しく使え!

Waf なんて書くな! WAF とかけ!

Pub/Sub とか

うっせーな。クラウドベンダー独自 API なんか使いたくねーんだよ。オラクルじゃあるまいし。

DCL、DMLDDLといった用語を知っていることをひけらかしたかったのかもしれない

まぁ、それは認める。でもさ、select や create とかのDML/DDLCRUD と同じだけと、DCL なんて権限を発行できるりょういきにトーシロを突っ込むわけにいかないだろ。何も考えずに GRANT TO なんてプロダクション環境で発行されて日には、権限消失されたら永遠にデータアクセスできなくなるかもよ?

現場に放り込まれても10年ぐらいかかる。というより、フロントからバックからレイヤからモバイルまでやることはもはや現実的ではない。

そりゃそうだけど、フロントエンドは移り変わりが激しいじゃないですか。ほんの数年前までは Flash と DoJa のアプリを作ることがフロントエンド開発者でしたよ?一方データベースや OS の方は、ここ三十年ぐらい UnixRDB鉄板だった書ないすか。低レイヤだっていうけど、IoT なんかで C言語開発者バリバリっすよ。例えば、クラウドフレアなんか CDN の再発明をしてますけど、サーバーラックを見る限りだと差がついているのは低レイヤ根本技術改善であって、私はそこにプロフェッショナル性を見出しますがね。

C言語ができないのに「おそらく QUIC か MQTT 」とか分かってない英単語文字を羅列するのは厨ニ病すぎます

わかっていないのはテメーの方だ。今日オーバーフロー問題を抱えている C/C++サーバーの開発をしようとするのが危険なのは承知しろよ。パフォーマンス必要とするなら Rust、または GC があるけど Go言語を使って実装すべきだろ。高学歴なのは結構だけどは、現実は見えてないのか?いい加減にしろ

片手間でできません。インフラエンジニアに触らせます

そうだね~。卓越したインフラエンジニアがすぐに手に入るなら、問題ないだろうけどさ、ベンチャーや硬直化した雇用形態我が国で有能なインフラエンジニアをすぐに採用できるかよ。何年前の知識で戦っているの?時代は DevOps なんですよ。必要とあらば、すぐ学んで、応用して、デプロイできるのに「インフラエンジニア採用から始める」なんて、ヨーロッパが衰退する理由もよくわかるよ。プププ。

NextSSRまで踏み込む結構

誰が NextSSR なんてするか!あれは SEO必要場合に限る。そもそも SSR なんて危険からまともなエンジニアだったらしないだろ。問題になってないだけで、本当のブラウザクローラが見える内容が違うなんてスパム認定されてもおかしくないんだ。クローラインデックスされるページで SPA をやろうとするやつはセンスないで。

MyISAMInnoDBに切り替えるなんてことしているところは無い。万にひとつあったとしても、大事で、それだけで数ヶ月のものなので、この付け焼き刃の知識の人が触る機会はない。

すいませんでした。本当にすいません。

Kafkaを触ったとかいているが、Kafkaはサーバで使ったのかな?どういう利用シーンかというと膨大なログ収集等で使うのだが(ただのNoSQLではない)、Zookkeeperで調停させて、topic数とか調整するんだけど、わかってます

ん? AWS SQS だとパフォーマンス問題があることしたいから Kafka を使いたいのよ。確かに Zookeeper のことは詳しくないよ。だけど、AWS MSK 使うんで。PaaS というもんがあるので、だめなん?ログ収集は GKE みたいに ログに出したら Fluentd収集してくれる時代になんでグチグチ言われないといけないの?

Redisちゃんと使えてる?pub/subとか分かってないと思う(普通に理解する必要あんまない)

ハア?インメモリデータベースに信頼するほどヤワじゃないから。Redis なんて飛んでなんぼ。だから Kafka のようなストレージに保存されるメッセージキューを利用したいの。

code deploy

これないと、CI の責務が大きくなるじゃん。ほんでもって、ArgoCD なんて Kubernetes で展開したら運用までしないといけないじゃん。メンドクサ。

アメリカ事情は知らないはずなので知らないことは書かないようにしましょう。

いや、J1ビザをとってアメリカ留学したことあるよ。あと、「世界もっとも強力な9のアルゴリズム」「CleanCoder」「戦うプログラマー」 の本に書いてあるじゃん馬鹿にしてるのか?

 なぜ、ヨーロッパ人が避けるかといと「やる気がないから」です。以上

SAPアマデウスITとか強いじゃん。うそつき

2021-04-24

政府情報発信不足って何?

情報ウェブでも公開してるのに発信不足って言われないようにどうすれば良いの?

情報記載したページを検索クローラブロック対象外にしている

省庁のトップページから3クリック以内で情報アクセス出来るようになっている

公式twitterアカウント情報追加、更新した際にtweetする

主管省庁のマスコミ向け定例記者会見で大まかな内容を発表する

あと何すれば良いのかな

ログイン ユーザー登録
ようこそ ゲスト さん