こんにちは、河野です。
これは TECHSCORE Advent Calendar 2015 の17日目の記事になります。
会員サイトなどのテストデータとして、偽の個人情報が必要になることがあるのですが、毎回そのデータの作成に困っていました。
少量のデータであればそれっぽいデータを手作業で作成できますが、数万件になってくると手作業では面倒くさいので作成できません。
かといって、重複が多いものや「AAA BBB」といった意味がなさそうなデータも使いたくありません。
そこで、偽の個人情報を作成するツールをGoで作りました。
kawaken/gimei-generator
(実際にランダムな名称を作成する部分は、mattn/go-gimeiを利用しています)
残念ながら、バイナリで配布できる状態まではたどり着きませんでしたので、インストールと使い方を説明します。
インストール
Goのインストール
ダウンロードページから自分のOS用のものをダウンロードして、PATHを通しておいて下さい。
https://golang.org/dl/
例えば、↓このページも参考になります。
インストール - The Go Programming Language
GOPATHも設定して、PATHに $GOPATH/bin を含めるとOKです。
gimei-generatorの取得と生成
GOPATHの設定まで終わっていれば、
1 |
go get github.com/kawaken/gimei-generator |
を実行すると $GOPATH/bin の中に gimei-generator が作成されています。
使ってみる
以下のように使用します。オプションの -n
が件数です
1 |
gimei-generator -n 10 名前,なまえ,住所 |
↓こんな感じで出力されます。
100万件でも余裕です。
1 |
gimei-generator -n 1000000 名前,なまえ,住所 > data.csv |
ファイルへ保存する機能はありませんので、OS標準のリダイレクトなどを使用して下さい。
ちゃんと100万件できてます!
気になる処理時間ですが、自分のPCでは1分程度で処理できました。
フォーマットに使える文字
フォーマットに使える文字とサンプルは以下の通りです。
- 漢字のフルネーム:"姓名", "氏名", "名前"
- ひらがなのフルネーム:"ふりがな", "せいめい", "なまえ"
- カタカナのフルネーム:"フリガナ", "セイメイ", "ナマエ"
あとは雰囲気でわかりますよね?
- "姓", "氏"
- "せい"
- "セイ"
- "名"
- "めい"
- "メイ"
- "住所"
- "じゅうしょ"
- "ジュウショ"
上記、指定フォーマット以外は、そのまま出力されます。
以上、gimei-generatorの説明でした。ぜひお試し下さい!