RubyのデータフレームライブラリRedAmberで解く Apache Arrowを利用したRubyのデータフレームライブラリであるRedAmberを作っている鈴木(@heronshoes)です。 この記事は下記の記事に触発された紹介記事です。 @sonota88さんはパーサに造詣が深いので、流石のアプローチだと思いました。 私も、データサイエンス100本ノック(構造化データ加工編)のRuby(RedAmber)版を作っているので、同じ 例題 -005 をやってみたらどうなるかご紹介したいと思います。 問題はこうです。 レシート明細データ(df_receipt)から売上日(sales_ymd)、顧客ID(customer_id)、 商品コード(product_cd)、売上金額(amount)の順に列を指定し、以下の全ての条件を満たす データを抽出せよ。 - 顧客ID(customer_id
Rubyアドベントカレンダー2022の18日目の記事です。 タイトルにあるRedAmberとは何かについては、それぞれ違う例を使いながらqiitaとnoteに記事を書いたので良かったら見てみてください。 とってもざっくりと言うと、Pythonにおけるpandas、Rにおけるdata.frame, dplyr/tidyrがやるようなことをRubyでできるようにするライブラリです。 2022年度Rubyアソシエーション開発助成に採択されたプロジェクトとして開発を進めています。 今日は、RedAmberで私がやろうとしていることをお話しします。 1. Rubyでデータサイエンスしたい 一番の目的はこれです。Rubyはデータ処理の分野が弱いです。それでも書きやすいRubyでデータサイエンスっぽいことをしてみたいです。そんな中、Red Data Toolsプロジェクトを始めとしていくつかのライブラリ
Rubyアドベントカレンダー2022の4日目の記事です。 鈴木弘一(@heronshoes)と申します。 Rubyの新しいデータフレームライブラリであるRedAmberをご紹介します。 RedAmberとは、Rubyでデータフレームを扱うためのライブラリです。 とってもざっくりいうと、Pythonにおけるpandas、Rにおけるdata.frame, dplyr/tidyrがやるようなことをRubyでできるようにするライブラリです。 2022年度Rubyアソシエーション開発助成に採択されたプロジェクトとして開発を進めています。 RedAmberのデータフレームとは RedAmberでは次のようなものをデータフレームと決めています。 同じ型のデータを1次元に並べたものを、Vectorと呼ぶ。 同じ長さのVectorを集めてひとまとまりの2次元データとし、DataFrameと呼ぶ 各Vecto
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く