[B! charset][encoding] Itisangoのブックマーク

Itisango id:Itisango

charsetとencodingに関するItisangoのブックマーク (27)

GitHub - dankogai/p5-encode: Encode - character encodings (for Perl 5.8 or better)
Itisango 2023/01/28
あとで読む

Perl

Encode

package

Class

charset

encoding

dankogai
リンク
Perlで正規表現を使って日本語の文字列にマッチさせる - masatoの日記
やりたいこと日本語の文字列に任意の文字列が含まれるかどうか判定したい。二通りのやりかたを書く。正規表現でマッチさせる use Encode qw/encode/; # source text my $str = 'メッセージ”通信エラー”が表示されます。'; my $p = '通信エラー'; $p = encode('utf8', $p); $str = encode('utf8', $str); if ($str =~ m/$p/) { # マッチをトライ print "Found it!!!"; } index関数を使うあるいは、index関数を使って任意の文字列が含まれるかどうかを判定できる。 ## index function if (index($str, $p) >=0) { print "Found it!!!\n"; } メタ文字にマッチさせたいときは、\でエスケー
Itisango 2021/05/17
#Perl

あとで読む

programming

software

development

Perl

regex

charset

encoding

Japanese

script
リンク
Encoding クラス (System.Text)
using namespace System; using namespace System::Text; int main() { String^ unicodeString = "This string contains the unicode character Pi (\u03a0)"; // Create two different encodings. Encoding^ ascii = Encoding::ASCII; Encoding^ unicode = Encoding::Unicode; // Convert the string into a byte array. array<Byte>^unicodeBytes = unicode->GetBytes( unicodeString ); // Perform the conversion from one enc
Itisango 2020/11/04
Encoding classes #dotNet

Microsoft

programming

software

development

.NET

C#

encoding

charset

あとで読む
リンク
Encoding.GetEncoding メソッド (System.Text)
名前空間: System.Text アセンブリ:System.Text.Encoding.dll アセンブリ:System.Runtime.dll アセンブリ:mscorlib.dll アセンブリ:netstandard.dll 重要一部の情報は、リリース前に大きく変更される可能性があるプレリリースされた製品に関するものです。 Microsoft は、ここに記載されている情報について、明示または黙示を問わず、一切保証しません。
Itisango 2019/09/03
#charset

Microsoft

programming

software

development

あとで読む

charset

encoding

Windows
リンク
.NET で文字エンコーディングクラスを使用する方法 - .NET
この記事では、.NET に用意されている、さまざまなエンコードスキームを使用してテキストをエンコードおよびデコードするためのクラスの使用方法について説明します。この手順は、.NET での文字エンコードの概要に関する記事を既に読んでいることを前提としています。エンコーダーとデコーダー .NET には、さまざまなエンコードシステムを使用してテキストをエンコードおよびデコードする、エンコーディングクラスが用意されています。たとえば、UTF8Encoding クラスには、UTF-8 へのエンコードと UTF-8 からのデコードに関する規則が記述されています。 .NET では、string インスタンスに対して UTF-16 エンコード (UnicodeEncoding クラスによって表されます) が使用されます。エンコーダーとデコーダーは、他のエンコードスキームでも使用できます。
Itisango 2019/09/03
#charset

あとで読む

microsoft

.NET

charset

windows

encoding

文字コード
リンク
postgreSQLの文字コード確認
PostgreSQLはオープンソースのオブジェクトリレーショナルデータベース管理システムです。 Oracle Databaseで使われるPL/SQLを参考に実装されたビルトイン言語で、Windows、 Mac、Linux、UNIX、MSなどいくつものプラットフォームに対応しています。 SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。
Itisango 2019/03/27
SELECT character_set_name FROM information_schema.character_sets; #PostgreSQL

language

SQL

プログラム

データベース

データ

言語

PostgreSQL

charset

encoding

information
リンク
Excelで作成したcsvとtxtの文字コードまとめ – 503DESIGN
BLOG / 2017.02.10 InDesignのデータ結合用のデータソースを選択する際に毎度エラーを出してしまうので備忘録をまとめようとした際に、どうにもボリューミーになったので別に。とりあえず手元で調べられるExcelの範囲内で。文字コードの判別は、Sublime Text 3の文字コードの表示と、Mac ターミナルのnkfコマンドをインストールして見ているので、正しい表記なのかはソフト頼りなので気になる方はご自身で見て下さい。環境：Windows Excel 2016 保存形式文字コード
Itisango 2018/07/16
悩ましい #Excel

Excel

CP932

UTF-8

encoding

charset

文字

文字化け

problem

Microsoft
リンク
エクセルで文字化けするCSVの修正方法 [Perl] All About
エクセルで文字化けするCSVの修正方法WebシステムからCSVをダウンロードしてパソコンのエクセルやその他のアプリケーションで開いたり、PCで作ったCSVがWebシステムにインポートすると文字化けする場合に、文字化けを回避する方法をご紹介します。 WebシステムからCSVをダウンロードしてパソコンのエクセルで開く、などは業務上よく行う作業だと思います。また、エクセルで整えたCSVファイルをWebシステムにインポートする場合もありますね。このような場合に日本語文字が文字化けしてしまうのを回避する方法をご紹介します。英語ベースのサイトでも大きなWebサービスだと日本語対応もある事が多いですが、マイナーなサービスを使っているような場合にインポート・エクスポート時の日本語文字化けを回避することができます。また、ご自身でWebサービスを運営する場合に文字化けせずにCSVを扱う方法をご紹介します。
Itisango 2018/07/16
charset

encoding

Excel

文字化け

CSV

issue

problem

CP932

UTF-8
リンク
[小ネタ][git] 日本語ファイルの文字化けを回避する | DevelopersIO
gitで日本語ファイルが文字化けするこんばんは。小室です。gitを使っていて日本語のファイル名を入れるとファイル名の表示が崩壊するという経験をしました。割と今までは放置していたのですが、きちんと日本語ファイル名を表示するコマンドを教えてもらったため、備忘録として記録しておきます。若干人を小馬鹿にしたようなファイル名のファイルを配置したディレクトリをサンプルとして用意しました。 $ ls -la total 8 drwxr-xr-x 4 komurohiraku staff 136 Mar 25 19:09 . drwxr-xr-x 22 komurohiraku staff 748 Mar 25 19:08 .. drwxr-xr-x 10 komurohiraku staff 340 Mar 25 19:08 .git -rw-r--r-- 1 komurohiraku staff
Itisango 2015/10/07
あとで読む

git

日本語

コマンド

ネタ

charset

encoding

CP932

UTF-8

文字コード
リンク
nkf でbase64 エンコード，デコードしたら結果が違う? – matoken's meme
小さなバイナリを受け渡ししたいけれどファイル共有サービスとか使うのも面倒だしbase64 にしてgist に貼ってしまおうと思ったのですが，nkf コマンドでbase64 にエンコードして，確認のためデコードしてみたら違う結果に． % cat original | nkf -MB > hoge % cat hoge | nkf -mB > fuga % diff original fuga バイナリーファイル original とfuga は異なります % ls -l -rw-r--r-- 1 mk mk 4080 5月 29 20:38 original -rw-r--r-- 1 mk mk 5422 5月 29 20:52 hoge -rw-r--r-- 1 mk mk 3999 5月 29 20:52 fuga Google+ にこのことを書いたら https://plus.goog
Itisango 2014/05/30
nkf

charset

convert

base64

encode

decode

UNIX

Linux

encoding

2014年
リンク
ssh接続先の文字コードが接続元と違うときの対処法 - 文字っぽいの。
問題自分の環境：UTF-8 SSH接続先：EUC-JP とかよくありますね。 $ export LANG=eucJP とか $ export LANG=ja_JP.UTF-8 してあげてもいいんですが、わざわざやるのも面倒ですし、「ログイン先とこっちのどっちで設定するといいんだ？」みたいに悩みます。解決法 cocotというツールを使います。 $ brew install cocot でインストール終わり。後は $ cocot -t UTF-8 -p EUC-JP ssh tarou@example.com とすると、手元のUTF-8環境に合わせて向こう側のEUC-JPをコンバートしてくれます。参考 Ubuntu日本語フォーラム / GNOMEの文字コードを常にEUC-JPにする方法
Itisango 2013/12/15
“cocot -t UTF-8 -p EUC-JP ssh tarou@example.com”

cocot

utf8

日本語EUC

EUC-JP

code

文字code

encoding

charset

2013年

ssh
リンク
Mysql toranomaki
カジュアルにMySQL Clusterを使ってみよう@MySQL Cluster Casual Talks 2013.09Mikiya Okuno
Itisango 2013/11/25
“ソフトウェアの自由、とりわけそのソフトウェアがどういったライセンスで提供されているかが重要であると考えているが、開発するプロセスについてはそれほど拘ってはいない。”

2013年

MySQL

運用

charset

encoding

slide

nippondanji

奥野幹也

徳島オープンセミナー

event
リンク
アルファベットをすべて選択して半角に統一する [ワード（Word）の使い方] All About
アルファベットをすべて選択して半角に統一する文書中のアルファベットをすべて全角や半角に統一したいと思ったことはありませんか。そのためには、文書中のすべてのアルファベット（全角・半角）を選択したあとで、全角や半角に置き換えると簡単です。今回は、その具体的な操作を紹介します。アルファベットだけを選択できたら便利なのに…… 文書中に「Windows」や「Office」といったアルファベットを入力するとき、皆さんは全角で入力していますか？あるいは半角でしょうか？私は半角で統一しています。理由は、仕事で書く原稿では半角のアルファベットを要求されるからです。Webサイトや雑誌・書籍などでは、半角アルファベットの方がきれいに見えるため、原稿も半角のアルファベットなのです。このため、仕事ではない文章を書くとき、たとえば私用のメールを書いたりブログを書いたりするときもアルファベットは半角で統一する癖
Itisango 2013/11/13
http://allabout.co.jp/gm/gc/322181/2/

2010年

ワード活用術

アルファベット

文字コード

charset

encoding

Microsoft

Office

Word

Microsoft Office
リンク
Unicode Security Guide
Welcome to the Unicode Security Guide! This guide has been designed to give Web application developers, software engineers, and application security researchers a reference for understanding Unicode-related security issues in operating systems, applications, and the Web. The dynamics of Unicode, and character encodings in general, are often misunderstood or poorly implemented, and lead to an array
Itisango 2013/07/30
id:hasegawayosuke さんがブクマしているので俺もブクマ。

unicode

security

guide

charset

encoding

hasegawayosuke
リンク
Rubyのエンコーディング - tmtms のメモ
Ruby 1.9 から文字列や正規表現オブジェクトはそれぞれエンコーディング(いわゆる文字コード)を保持するようになりました。たとえば 0xB1 0xB2 という２バイトは EUC-JP エンコーディングでは「渦」、SHIFT_JIS エンコーディングでは「ｱｲ」という文字になります。つまり同じバイト列でもエンコーディングが異なれば異なる文字として解釈されます。 1.8 では文字列はただのバイト列でした。なので、それがどのような文字を表しているのか、つまりエンコーディングが何なのかはプログラムが知っている必要がありました。 1.9 では文字列オブジェクト自身が自分が何のエンコーディングかを知っています。同じ 0xB1 0xB2 というバイト列でも、それが EUC-JP の「渦」なのか SHIFT_JIS の「ｱｲ」なのかは、文字列自身が知っています。スクリプトエンコーディングスクリプ
Itisango 2012/08/12
ruby

encoding

文字コード

encode

coding

ASCII

charset

2012年
リンク
MySQL日本語利用徹底入門
1. <Insert Picture Here> MySQL 日本語利用徹底入門日本オラクル株式会社 MySQL Global Business Unit テクニカルアナリスト奥野幹也 2012 年 5 月 29 日 Copyright© 2012, Oracle. All rights reserved. 2. 2 以下の事項は、弊社の一般的な製品の方向性に関する概要を説明するものです。また、情報提供を唯一の目的とするものであり、いかなる契約にも組み込むことはできません。以下の事項は、マテリアルやコード、機能を提供することをコミットメント（確約）するものではないため、購買決定を行う際の判断材料になさらないで下さい。オラクル製品に関して記載されている機能の開発、リリースおよび時期については、弊社の裁量により決定されます。 Oracle と Java は、 Oracle Cor
Itisango 2012/07/24
MySQL

slideshare

データベース

DB

日本

文字コード

charset

encoding

Oracle
リンク
ぼくがPDOを採用しなかったわけ(Shift_JISによるSQLインジェクション)
補足この記事は旧徳丸浩の日記からの転載です。元URL、アーカイブ、はてなブックマーク1、はてなブックマーク2。備忘のため転載いたしますが、この記事は2010年7月1日に公開されたもので、当時の徳丸の考えを示すものを、基本的に内容を変更せずにそのまま転載するものです。補足終わり PHPのデータベース・アクセス・ライブラリPDOは、DB接続時の文字エンコーディング指定ができないため、文字エンコーディングの選択によっては、プレースホルダを使っていてもSQLインジェクション脆弱性が発生します。追記(2011/06/19) ここに来て急にブクマが追加されはじめていますが、このエントリを書いてから状況が改善しています。PHP5.3.6(2011/03/17)にて、PDOでもデータベース接続の文字エンコーディングを指定できるようになりました。この版で、UNIX版のPHPでは解決しましたが、Win
Itisango 2011/06/19
DB

php

mysql

sqlinjection

security

charset

encoding

文字コード
リンク
LC_ALL環境変数とsortコマンド - sileのブログ
自分の環境では、sortコマンドを実行する時にLC_ALL環境変数に'C'をセットするかしないかで、処理終了までの時間が著しく変わる。 # 約40万行のデータ > wc -l words 392126 words # 入っているのはUTF-8の日本語(IPA辞書を利用) > head words やぼったいやぼったしやぼったからやぼったかろやぼったかっ # 普通のソート > time sort words > /dev/null real 0m37.158s user 0m37.098s sys 0m0.056s # LC_ALL=Cでのソート > time LC_ALL=C sort words > /dev/null real 0m0.293s user 0m0.284s sys 0m0.008s ロケールを考慮してソートするかどうかの違いだと思うが(LC_ALL=Cの場合は、
Itisango 2010/06/12
linux

text

command

unix

sort

locale

charset

encoding
リンク
Webアプリのセキュリティ - 極楽せきゅあブログ
徳丸さんがまっちゃのLT資料公開されてますが＞http://d.hatena.ne.jp/ockeghem/20090917/p1、その資料はもちろんのこと、Relatedで出てくる資料も興味深いですね。 http://www.slideshare.net/fmavituna/how-to-detect-xss http://www.slideshare.net/markstanton/be-afraid23 http://www.slideshare.net/d0nut/webhacks-am-beispiel-php-mysql http://www.slideshare.net/manugoel2003/php-security http://www.slideshare.net/skyhawk133/protecting-your-web-sitefrom-sql-injectio
Itisango 2009/09/23
web

charset

encoding

xss

security

matcha445

links
リンク
何故かあたり前にならない文字エンコーディングバリデーション
(Last Updated On: )私が4年前（2005年）に「Webアプリセキュリティ対策入門」を執筆していた時には、既に壊れた文字エンコーディングなどの不正な文字エンコーディングを利用したJavaScriptインジェクションやSQLインジェクション攻撃は比較的広く知られていました。この問題は当時のスラッシュドットジャパンでも取り上げられていました。/.で取り上げられたので、そこら中のWebサイトとユーザが被害に合うのでは？とヒヤヒヤしたので良く覚えています。不正な文字エンコーディングを利用した攻撃は、文字エンコーディングを厳格に取り扱い、文字エンコーディングをバリデーションすれば無くなります。これを怠ると、システムのどこで問題が発生するか予想できなくなります。つまり、いい加減に文字エンコーディングを取り扱うと安全なシステムは作れないのです。参考：エンジニア向けにもう少し解りやすい
Itisango 2009/09/14
charset

encoding

security

validation

programming

web

PHP

あとで読む

セキュリティ

プログラミング
リンク
1 2 次のページ