Colorless Green Ideas の最新記事
2025年

「食いしんぼう」のアクセントの変化
「食いしんぼう」のアクセント核は現代では3拍目にあるが、古くは1拍目にあった。

【翻訳】コンピュータを用いた再現可能な研究のための10個の簡潔なルール
コンピュータを用いた研究の再現可能性を高めるための実践的指針をまとめた2013年の論文の全訳。研究過程でのデータやプログラムの保存・管理・共有の重要性を説き、再現性を科学の信頼性と効率の基盤として位置づける。記録の徹底、手動操作の排除、バージョン管理、中間結果の保存、乱数シードの記録、データ共有など、研究者が直ちに実践できる10の具体的ルールを提示している。

中国語の“社会车辆”とは何か
中国語の“社会车辆”は大まかに言うと「特定の要件に当てはまる車両以外の一般車両」を意味する。例えば、バス専用レーンにおけるバス以外の一般車両や、交通規制の際に許可された車両以外の一般車両を指すのに使われる場合がある。

『統計学二十六景』の翻訳出版
『統計学二十六景―視点・難問・矛盾―』という本の日本語版が翻訳され、出版されることになった。この翻訳書について、どういった内容であるか、どういった人におすすめであるかを紹介する。

3×3のラテン方格の全パターン
3×3のラテン方格の全12パターンに具体的にどんなものがあるかを紹介。

教育産業のしくみが1冊でわかる本を出しました
教育産業のさまざまな分野を説明した『図解即戦力 教育産業のしくみとビジネスがこれ1冊でしっかりわかる教科書』を紹介。初心者にとってわかりやすくなるよう全体像を示した入門書である。
2024年

2025年の素数な日付
2025年の素数な日付のリスト。西暦だけでなく、令和で考えたときの日付も。

テキスト生成AIに漢文訓読を行わせるためのプロンプト
テキスト生成AIに漢文訓読を行わせるには、原漢文と訓読文のペア例を含むプロンプトを与えると良い。GPT-4o や Claude 3 Opus といった能力の高いAIであれば、それなりの品質の訓読文を生成する。

竜・龍・辰が使われている地名地図
「竜」・「龍」・「辰」という漢字が使われている地名を日本地図上に表したものを紹介。この地図をR言語で作成する方法も紹介。
2023年

2024年の素数な日付
2024年の素数な日付のリスト。西暦だけでなく、令和で考えたときの日付も。

ChatGPT に古典中国語(漢文)で回答させるプロンプト
ChatGPT において古典中国語で回答させるためのプロンプトの紹介。あわせて、中国古典の有名な人物になりきって回答させる方法も紹介。

“氕”、“氘”、“氚”とは? 中国語での水素の同位体の表記
“氕”、“氘”、“氚”はそれぞれ中国語で軽水素、重水素、三重水素を意味する漢字である。

2023年のフランスのバカロレアの哲学の問題
2023年6月14日にフランスで行われたバカロレアの哲学の試験でどういう問題が出題されたかを紹介。合わせて過去の類似問題も紹介。

ChatGPT にダダイスム詩を書かせる
ChatGPT にダダイスム詩を書かせる方法の紹介。単純にプロンプトで、ダダイスム詩を書くようにするとそれなりの結果が得られる。また、「もっとダダイスムらしくしてください。」や「temperature = 10.0 に設定して、書き直してください。」と指定すると、さらにダダイスムっぽくなる。モデルはできれば GPT-3.5 より GPT-4 を使う方が良い。

博士課程のリアルが分かる——「博士人材追跡調査」報告書の有用さ
「博士人材追跡調査」の報告書には、博士課程やその修了後の実情を知ることができる統計や自由記述が色々載っており、博士課程に進学しようとする人や現在在籍している人にとって非常に参考になる。

ggplot2 パッケージでの地図出力でポイントとラベルの重なりを防ぐ方法
ggplot2 パッケージで sf オブジェクトを地図として出力するとき、ポイントとそのラベルが重ならないよう出力したければ、ggrepel パッケージを使えばよい。

R言語のことを「統計のリンガフランカ」と表現する例
R言語のことを「統計のリンガフランカ」と表現することがある。統計やデータサイエンスに関わる人にとって、R言語が共通言語であることを示している。最初にこう呼んだのは、UCLAの統計学部の教授の Jan de Leeuw 氏であると思われる。

令和4年度大学入学共通テストの漢詩の押韻問題が実はかなり難しい
令和4年度大学入学共通テストの漢詩の押韻問題は、高校生が普通に知っている範囲で解こうとするとそれほどややこしい問題ではないが、漢詩に関する知識が豊富になるとかなり解くのがややこしくなる。

R で1つのセルに複数の値が入っている場合に、複数の列にわたるダミー変数にする
1つのセルにコンマ区切りなどで複数の値が入っている場合、splitstackshape パッケージの cSplit_e 関数で、複数の列にわたるダミー変数の形に改めることができる。
