サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
iPhone 16e
labo-code.com
時系列分解の意義 多くの実世界のデータは、時間的な変化を伴った時系列データとして記録されます。需要予測、気象予報、株価分析など、時系列データを分析する分野は多岐にわたります。 時系列データは大抵以下のような構造が含まれています。 トレンド(Trend) : 長期的に増減する動き 季節成分(Seasonality) : 1年や1か月など一定の周期で繰り返す変動 残差(Residual) : 不規則な変動やノイズなど これらの成分を分解して扱えると、データの理解が格段に進み、将来予測や異常検知に応用する際にも有利になります。 伝統的な時系列分解モデル 加法モデル(Additive Model) 古典的な加法モデルによる時系列分解では、時系列 $y_t$ を以下のように表します。 $y_t = T_t + S_t + R_t$ $y_t$: 観測値 (Observed series) $T_t$
前回の記事で、scVeloを用いたRNA Velocity解析の基本を学びました。しかしながら、NCBI SRAなどの公共データベースのfastqファイルからどのようにRNA Velocity解析をやるのかイメージがつきづらいかと思います。この記事では、cellrangerから出力されたBAMファイルをvelocytoに読み込ませてloomファイルを作成して、RNA Velocity解析するためのファイルを準備する方法を学びます。 これによって好きな公共のシングルセルデータを使ってRNA Velocity解析ができるようになります。ぜひ学んでいきましょう。
10x Genomics Cell Rangerのデータを読み込むには? 結論からいうと、10x Genomics Cell Ranger pipelineのデータを読み込むにはmonocle3のload_cellranger_data()を使います。公式サイトでも言及されています。 https://cole-trapnell-lab.github.io/monocle3/docs/getting_started/#10x-output # Provide the path to the Cell Ranger output. cds <- load_cellranger_data("~/Downloads/10x_data") 注記: load_cellranger_dataは、umi_cutoffという引数を取ります。これは、セルに含まれるべきリード数を決定するものです。デフォルトでは
Trajectory解析とは? Trajectory解析(軌跡解析、軌道解析とも呼ばれる)は、シングルセルRNAシーケンス(scRNA-seq)データの解析において、細胞が時間経過とともにどのように状態を変化させていくのか、その過程(軌跡)を推定する手法です。従来のバルクRNA-seqでは細胞集団の平均的な遺伝子発現しか見えませんでしたが、scRNA-seqによって個々の細胞のトランスクリプトームを捉えることができるようになり、Trajectory解析によって細胞の動的な変化をより詳細に理解することが可能になりました。 Hussein A et al., 2021 より引用 https://www.nature.com/articles/s41467-021-26282-z Trajectory解析は、以下のような疑問に答えるのに役立ちます。 幹細胞はどのような細胞に分化していくのか?その
RNA Velocity解析とは? RNA Velocity解析は、一言で言うと、個々の細胞がどのような状態に変化していくのか(分化や状態変化の方向と速度)を予測する技術です。従来のRNA-Seqは細胞のスナップショット(静的な情報)しか捉えられませんでしたが、RNA Velocityは細胞内のmRNAのスプライシング状態に着目することで、時間的な変化(動的な情報)を捉えることを可能にしました。 https://www.nature.com/articles/s41586-018-0414-6 Bergen V, et al. Generalizing RNA velocity to transient cell states through hidden time. Nat Biotechnol. 2020;38(12):1408-1414. より引用 RNA Velocity解析では、
Trajectory解析をやってみたくないでしょうか。Trajectory解析ができれば、細胞の分化経路や遷移状態を推定することができます。しかし、Trajectory解析に用いるMonocle3はインストールが難しいことで定評があり、なかなか手が出せない人も多いのが現状です。本記事ではまずMonocle3をインストールするために、Rのパッケージ管理ツールであるrenvとRバージョン管理ツールであるrigを使って、Monocle3をインストールするところまでやってみます。 Trajectory解析を行う土台ができますので是非挑戦してみましょう。
空間トランスクリプトームの解析手法について行えるようになりたくありませんか?組織内の遺伝子発現を空間情報と関連付けて解析することで、空間情報と遺伝子発現を結びつけることで組織微小環境下における細胞間相互作用の理解につながります。本記事では、空間トランスクリプトーム解析の初歩的なプログラムを動かすことができるようになることを目標としています。ぜひトライしてみましょう。
宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳細については、iGEM-Wasedaの成果報告サイトをご覧いただければ幸いです。 In Silico Evolution Pipelineとは このプロジェクトは、PET(ポリエチレンテレフタレート)を分解する酵素であるPETaseの分解活性を高めることで、BIND-
解きたい問題 今回解きたい方程式は次のようなものです。 次の $u(x, t)$ にかんする偏微分方程式を与えられた条件のもとで解いてください。 $$ \frac{\partial^2 u}{\partial t^2} = (x + 1)\frac{\partial^2 u}{\partial x^2} + xe^{-t};\quad 0\le x\le 1, \quad 0\le t< \infty $$ 初期条件: $u(x, 0) = \sin \pi x, \frac{\partial u}{\partial t}(x, 0) = 0$ 境界条件: $u(0, t)= 0, u(1, t) = 0$ 方程式を解くプログラムをFortranで実装する こちらのページで解説されているように方程式を差分化して数値計算で答えを求めるプログラムを作成します。 Fortranで実装すると次のよ
宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳細については、iGEM-Wasedaの成果報告サイトをご覧いただければ幸いです。 タンパク質言語モデルとは タンパク質言語モデルとは、自然言語処理(NLP)の技術をタンパク質のアミノ酸配列に応用し、タンパク質の機能や構造を予測するためのAIモデルです。 自然言語の文章
この記事では、EvoProtGradというツールを通して、タンパク質言語モデルを利用した指向性進化について紹介します。この記事を読むことで、コンピュータ上でタンパク質のアミノ酸配列に変異加えて、より高機能な変異体を探索する方法を学べます。ぜひトライしてみてください! 宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーションに関わる部分のツールの一部を紹介しています。プロジェクトの詳
0. 量子化学計算用のソフトウェア: PySCFとは 参考文献[1]から引用 PySCF(Python Simulations of Chemistry Framework)は、Pythonベースのオープンソースの量子化学計算フレームワークです。PySCFは、高度な電子構造計算をシンプルかつ効率的に実行するためのツールを提供し、研究者や学生が量子化学の計算を容易に行えるように設計されています。 PySCFの主な特徴は以下の通りです: モジュラー設計:PySCFは、計算の各ステップ(分子の構造定義、基底状態の計算、励起状態の計算など)をモジュールとして提供しており、必要な部分だけを組み合わせて使用することができます。 高性能計算:内部に高度なアルゴリズムを使用しており、大規模な計算でも高速に処理を行うことができます。 柔軟性: Pythonベースであるため、スクリプトを通じて簡単に操作や拡張
本記事では、Pythonからタンパク質設計ツールRosettaを操作できるPyRosettaの使い方を紹介します。この記事を読むことで、PyRosettaのセットアップ方法や、分子ドッキングに必要なエネルギー最小化を行う方法、さらにロゼッタスコアを使ってタンパク質の安定性を評価する方法を学べます。ぜひトライしてみてください! 宣伝 こちらの記事は合成生物学大会iGEMの強豪校であるiGEM-Wasedaさん協力のもと執筆されました。ご協力誠にありがとうございます! 【iGEM-Waseda】は合成生物学の研究を行う早稲田大学の学術サークルです。iGEMと呼ばれる合成生物学の世界大会の世界大会に出場するために日々研究に励んでいらっしゃいます。 本記事では、iGEM2024で日本Undergrad部門で史上初のTOP10に選ばれたプロジェクトの一環として、特にIn Silicoシミュレーション
はじめに Fortranには長い歴史があり、先人たちが作成した効率の良いアルゴリズムで実装されたプログラムがライブラリとして提供されている場合があります。これらのライブラリを自分たちのプログラムで使わない手はありません。 今回は、LAPACK / BLASという線形代数の計算ライブラリを利用する方法と、これらのライブラリを使うといかに実行速度が速くなるかを示したいと思います。 macOS Sonoma(14.7), gfortran (gcc version 14.1.0), Processor: 2.4 GHz 8-Core Intel Core i9, Memory: 32 GB 2400 MHz DDR4
Rを用いたsingle-cell ATAC-Seq data解析の方法をご存じでしょうか。single-cell ATAC-Seq data解析を行うと、各細胞ごとにクロマチンアクセシビリティー状態の分布を解析することが可能です。とても便利な手法なのでぜひチャレンジしてみましょう。 windows 10, R 4.4.0, Seurat 4.3.0, EnsDb.Hsapiens.v75 2.99.0, tidyverse 2.0.0, hdf5r 1.3.11, biovizBase 1.52.0, Signac 1.13 single-cell ATAC-Seq data解析とは? single-cell ATAC-Seq data解析とは、single-cell Assay for Transposase-accessible Chromatin with Sequencingの略で
近年、リモートセンシングデータの時系列解析は、地球科学や環境モニタリングの分野で重要性を増しています。代表的な例として、植生指標のNDVI(Normalized Difference Vegetation Index)があります。NDVIの経年変化を追跡することで、農業、森林管理、植生調査など、幅広い分野でのモニターや研究に活用されています。 しかし、リモートセンシングデータの解析には特有の課題が存在します。大気条件の変動、センサーの視野角の変化、雲の影響などにより、データにノイズが混入します。このノイズは季節変動や長期トレンドといった重要な情報を不明瞭にし、時系列解析の精度を著しく低下させる可能性があります。 本記事では、これらの課題を効果的に解決するツールとして、Savitzky-Golayフィルタを紹介します。このフィルタは、時系列データから有意な信号を抽出しながら、ノイズを効率的に
バッチ補正とは? バッチエフェクトとは、非生物学的な要因、つまり実験のセットアップや手順、機器の違いなどによって生じるデータのバリエーションのことを指します。これは、異なるバッチで生成されたデータを比較するときに特に問題となります。バッチエフェクトは、結果の解釈を歪め、偽の相関を生じさせる可能性があります。したがって、scRNA-seqデータを解析する際には、バッチエフェクトを適切に補正することが非常に重要です。 Harmonyとは? Harmonyは、各イテレーションで各クラスタのセルが可能な限り多くのバッチから来るようにする反復クラスタリングメソッドを使用し、各セルに適用する補正係数を計算します。このプロセスを繰り返してイテレーションごとに洗練し、収束するまで繰り返します。 https://portals.broadinstitute.org/harmony/articles/quic
Google colab, pyscf 2.6.2, py3Dmol, PubChemPy 1.0.4., rdkit 2024.3.5, Avogadro 1.2.0 量子化学計算用のソフトウェア: PySCFとは 参考文献[1]から引用 PySCF(Python Simulations of Chemistry Framework)は、Pythonベースのオープンソースの量子化学計算フレームワークです。PySCFは、高度な電子構造計算をシンプルかつ効率的に実行するためのツールを提供し、研究者や学生が量子化学の計算を容易に行えるように設計されています。 PySCFの主な特徴は以下の通りです: モジュラー設計:PySCFは、計算の各ステップ(分子の構造定義、基底状態の計算、励起状態の計算など)をモジュールとして提供しており、必要な部分だけを組み合わせて使用することができます。 高性能計算:
In silico screeningとは? In silico screening(インシリコスクリーニング)とは、バーチャルスクリーニングの一種で、コンピューターシミュレーションを使用して、大規模な分子ライブラリーから、特定の生物学的標的に対して有望な化合物を選別するプロセスです。 In silico screeningでは、コンピューターモデルを用いて、大量の化合物の構造情報や生物学的活性を予測し、検討対象とするターゲットに対して最適な化合物を探索することができます。 このプロセスは、実験的に合成する前に、有望な化合物を選別し、合成の労力や費用を節約することができます。また、実験的なスクリーニングよりも高速であり、より多くの化合物を同時に検討できるため、薬物開発の効率を高めることができます。 In silico screeningは、薬剤の探索や、化学物質の特性予測、新しい材料の設計
はじめに 前回の記事では、1/4円の積分から円周率を求めるプログラムを使って、doループとファイルの書き出しというFortranを使った計算をするときに最も基本的でよく使うであろう機能を紹介しました。 その時には、積分計算の際に使われる分割数については、分割数が書かれただけのテキストファイルを用意し、結果を出力するファイルの名前については、プログラム本体に書いて指定していました。 しかし、実際の計算では、設定すべき変数の数が膨大になる場合があります。前回のような運用では行き詰まること必至です。前回のような書式のテキストファイルで変数の値を与える場合、何行目にどの変数の値を書いておく、というのを覚えておかなければならないですし、設定した値をあとから見直すのも難しいでしょう。 このような場合、namelistという機能を使うと便利です。ある決められた書式で書くことで、たくさんの変数の値を簡単に
1. 量子化学計算用のソフトウェア: PySCFとは 参考文献[1]から引用 PySCF(Python Simulations of Chemistry Framework)は、Pythonベースのオープンソースの量子化学計算フレームワークです。PySCFは、高度な電子構造計算をシンプルかつ効率的に実行するためのツールを提供し、研究者や学生が量子化学の計算を容易に行えるように設計されています。 PySCFの主な特徴は以下の通りです: モジュラー設計:PySCFは、計算の各ステップ(分子の構造定義、基底状態の計算、励起状態の計算など)をモジュールとして提供しており、必要な部分だけを組み合わせて使用することができます。 高性能計算:内部に高度なアルゴリズムを使用しており、大規模な計算でも高速に処理を行うことができます。 柔軟性: Pythonベースであるため、スクリプトを通じて簡単に操作や拡張
4. TD-DFTとは? TD-DFT(Time-Dependent Density Functional Theory、時間依存密度汎関数理論)は、分子の励起状態の性質を研究するための計算手法です。通常の密度汎関数理論(DFT)は基底状態のエネルギーと電子分布を求めるのに対し、TD-DFTは時間依存する系の応答を解析し、分子の光学的性質を評価するために使用されます。 TD-DFTの基本概念 TD-DFTは、電子密度の時間発展を追跡することで、分子の励起状態を解析します。これにより、電子遷移エネルギー(吸収波長)や振動子強度(吸収強度)を計算し、UV-Visスペクトルを予測することができます。TD-DFTは、以下のような特徴を持っています: 効率性:従来の励起状態計算手法(例えば、配置間相互作用法や多配置自己無撞着場法)に比べて計算コストが低く、大規模な分子系に対しても適用可能です。 精度
はじめに 前回の記事では、ソースコードをコンパイルするためのコンパイラのインストールを行い、「Hello, World!」をターミナル上に出力しましたが、これだけでは全く使い物になりません。 これからいくつかの記事に分けてFortranプログラミングを紹介していきますが、今回は、必ず知っておかなければならない繰り返し処理のための doループおよびファイルの入出力について説明します。 説明だけ見てもよくわからないと思いますので、1/4円の積分を使って円周率を求めるプログラムを例にとって説明します。
細胞アノテーション(注釈付け)とは? 細胞アノテーションとは、細胞が発現しているRNA量(発現遺伝子)に基づき、細胞名を決定することです。これにより、試料の中にどんな細胞が存在していたのかを同定する事が出来ます。 以下でもう少し詳しく説明します。 細胞アノテーションは遺伝子の発現情報に基づき、データベースの細胞タイプの中から最も類似した細胞タイプを割り当てます。これには様々な方法があり、今回はdecouplerとCellTypistについて解説します。 decoupler decouplerは、クラスタリングした後のデータに対して、それぞれのクラスターの遺伝子の発現量と、データベースの細胞の発現量を比較します。そこで統計的な検定を行い、データベースの中でもっとも類似した細胞タイプを割り当てます(加えて、他のグループよりも有意に類似度が高い細胞タイプを選ぶ)。RのSingleRとほぼ同じ手順
HANTS法とは? HANTS(Harmonic ANalysis of Time Series)は、リモートセンシングデータの時系列解析に使用される手法の一つで、時系列データを周期的な成分(調和成分)に分解し、ノイズや異常値を除去しながらデータを再構築する手法です。今回はNDVIでよく利用されるZhou et al., 2015の方法をもとに、この方法の基本的な考え方と動作原理を以下に解説します。 HANTSの基本概念 1. 理論的背景 HANTS法は、フーリエ級数展開の考え方を基礎としています。フーリエ級数展開では、任意の周期関数を正弦波と余弦波の和で表現できるという原理を用います。HANTS法は、この原理を時系列データに適用し、データに含まれる様々な周期成分を抽出します。 2. 基本モデル HANTS法では、時系列データ $y(t_j)$を以下のようにモデル化します: $$ \til
擬似バルク RNA-seq 解析(pseudo bulk RNA-seq analysis)とは? 疑似バルク解析(pseudo bulk analysis)とは、シングルセルRNA-seqデータを用いて、bulk RNA-seqの解析手法を適用できるようにすることです。以下でもう少し詳しく説明します。 バルクRNA-seqとは バルクRNA-seqは、多数の細胞から抽出されたRNAをまとめて解析します。比較的安価で、広く利用されています。scRNA-seqと違って全体のRNA発現プロファイルを提供しますが、個々の細胞の違いは反映されません。そのため大規模な発現変動の解析、遺伝子発現のパターンの特定、疾患関連遺伝子の発見などに適しています。 疑似バルク解析とは 疑似バルク解析(pseudo-bulk analysis)は、シングルセルRNA-seq(scRNA-seq)データを用いて、バル
量子化学計算用のソフトウェア: PySCFとは PySCF(Python Simulations of Chemistry Framework)は、Pythonで書かれた無料・商用利用が可能なオープンソースの量子化学計算Pythonライブラリです。PySCFは特に電子構造計算に対応しており、密度汎関数理論(DFT)、ハートリー・フォック法、ポストハートリー・フォック法など多様な計算手法をサポートしています。利用者はPythonを用いて容易に計算セットアップを行うことができ、拡張性とカスタマイズの自由度が高いため、研究開発に適しています。[1]。 参考文献[1]から引用 1. 分子軌道とは? 1.1 分子軌道の定義 分子軌道(Molecular Orbital, MO)は、分子内の電子の存在確率を記述する数学的関数です。分子軌道は、個々の原子軌道が結合または反結合して形成されます。分子軌道理
この記事は、Pythonで量子化学計算ができるPyscfを用いて、分子のIRスペクトルや熱力学的特性を取得する方法を解説します。DFT計算による構造最適化、振動数計算、IRスペクトルの可視化、熱力学的特性の取得までを扱います。これにより、Pyscfの物性解析を理解し、分子の最安定構造を得る方法を学ぶことができます。また、理論的なIRスペクトルと実験結果の比較による分子同定することが出来るようになります。
本記事は低分子化合物の毒性予測について書かれた記事です。2024年に公開された最新のVenomPred 2.0というツールを用いて、QSARによる毒性予測と毒性になりうる構造(Toxicophore)の予測を行います。こちらの内容が理解できると、望みの化合物の毒性、それを引き起こす可能性のある官能基を簡単にわかることができるようになります。ぜひ皆さんもトライしてみて下さい!
次のページ
このページを最初にブックマークしてみませんか?
『トップページ - LabCode』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く