ひきこもり村AI研究部

とりあえずMV制作を一つの共通目標とするなら、SUNOから入るのが良さそうだなと今日使ってみて思いました。ポエム作りなら無制限に楽しめるし、曲化も一つ前のVer4.5だけど1日5回(一度に2パターン自動生成の10曲)なら試せるので。良い詞と曲があれば、映像も大分作りやすいし、モチベーションも全然変わってくるかなと。

そうですねw ゆらぎねこさんが立ててくれたAI生成ポエムトピックとか、あらたにトピックを作ってそこなどで成果物の経過を発表していければ何かやってる感がでそうでいいですねw

僕はMV制作挑戦のコアメンバーを4人(僕含めて5人)を募って、週1回(土曜あたり)にDiscord通話しながら、他の人が求めている言葉や音楽をみんなで一斉に生成するAI結作業ということをやっていくと良いじゃないか?と飛ばし気味に考えていましたが、月1回くらいが負担にならずに良さそうですね。

アクセルを緩めてくれて助かります。結構思いついたら突っ走ってしまうタイプなので :sweat_smile:月一回ペースにゆるめて、月ごとのメインの人を決め、同じことをやってみるのも良さそうですね。

そうですね。よろしくお願いします。元旦は飛ばし過ぎでしたが3日くらいまでには一度Discordでミーティングを開いて、2026年AI研究部活動の一年の計を立て始動させましょう~。

「いいね!」 1

GPUを新調したのですが50Seriesは結構微妙ですね。値段は高い割に性能の伸びは微妙、ドライバの対応もいまいち。
使用電流も高電流にちかくて融解が頻繁に発生。発熱がかなり高いから冷却も考慮しないといけない。電源がW帯域足りていても電流の品質が悪いと立ち上がらない。
中古でもいいなら30Seriesあたりがおすすめです。

「いいね!」 2

なるほど。前の40シリーズはどうなんですかね。30シリーズよりも性能がよさそうな感じがするんですけども。

「いいね!」 2

40Seriesの方が性能いいとはいわれてますね。40Seriesの新品は市場在庫がなくなって50Seriesぐらいに値上がりしてます。

Sample1のケースなのでどこまで正しいのかは若干不安ではありますけど。
GPUのVRAM問題なのではないかと思ってます。GPUの使用電力は70Wとそれほど高電力ではないのに95Cまで上がってます。これもFAN回転数を倍に設定して105Cから下げている状況です。(初期設定だとAI学習でGPU落ちます。)

ただこれOS側の設定確認で見れるんですけどNvidiaアプリ側の設定だとGPUの複数POINTからの確認では無くて恐らくGPU CORE?のスカラー量しか表示しておらず結構悪質なやり方だと思いますね。

この温度体の劣化は結構早いらしいのでGPU自体早く劣化するかもしれないです。ただ温度を下げると今度はFANの劣化や音が問題になります。

結局はVRAMの熱の制御に帰結しそうですけど。自分はその辺あまり詳しくないですし素直にDGX SPARKかえば良かったかもと若干後悔中です。

VRAM熱問題自体は3080 3090ぐらいから問題になってきてたらしいですね。徐々に顕在化してきたようです。
結局のところこれ以上のGPUの進化は難しくなってきてて、相当無理をしてみかけのパフォーマンス伸ばしてる気がします。

$ sensors
amdgpu-pci-0f00
Adapter: PCI adapter
vddgfx: 984.00 mV
vddnb: 1.02 V
edge: +92.0°C <CPU 温度
PPT: 8.00 mW

k10temp-pci-00c3
Adapter: PCI adapter
Tctl: +95.4°C

acpitz-acpi-0
Adapter: ACPI interface
temp1: +16.8°C

gigabyte_wmi-virtual-0
Adapter: Virtual device
temp1: +40.0°C
temp2: +48.0°C
temp3: +95.0°C <おそらくGPUのVRAM温度
temp4: +43.0°C
temp5: +57.0°C
temp6: -55.0°C

r8169_0_600:00-mdio-0
Adapter: MDIO adapter
temp1: +46.5°C (high = +120.0°C)

$nvidia-smi
Thu Dec 18 10:33:27 2025
±----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.95.05 Driver Version: 580.95.05 CUDA Version: 13.0 |
±----------------------------------------±-----------------------±---------------------+
| GPU Name Persistence-M | Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap | Memory-Usage | GPU-Util Compute M. |
| | | MIG M. |
|=========================================+========================+======================|
| 0 NVIDIA GeForce RTX 50 Off | 00000000:01:00.0 On | N/A |
| 70% 41C P1 69W / 220W | 1793MiB / 12227MiB | 98% Default |
| | | N/A |
±----------------------------------------±-----------------------±---------------------+

±----------------------------------------------------------------------------------------+
| Processes: |
| GPU GI CI PID Type Process name GPU Memory |
| ID ID Usage |
|=========================================================================================|
| 0 N/A N/A 1650 G /usr/lib/xorg/Xorg 156MiB |
| 0 N/A N/A 2297 G xfwm4 3MiB |
| 0 N/A N/A 3204 C python 1592MiB |
| 0 N/A N/A 4217 G nvidia-settings 0MiB |
±----------------------------------------------------------------------------------------+

「いいね!」 2

なるほど。(実はよくわかってないw)40と50はお値段高すぎて、一般人には手が届かないパーツになっていきそうですね。

AI専用PCもお高くなりそうですし、庶民はちまちま、企業の提供するクラウドAIに課金してやっていくしかないような気がします。

「いいね!」 1

とういうわけで、最近は自作PCを作ってAIを動かすというのも、なかなか庶民には高値の花となってきたわけですが、クラウドAIに課金するのも、昨今の物価高を考えるとなかなか厳しいものがあり、ツールや使い方を工夫して、なんとかAIをがんばるしかない状況です。(AIをがんばるとは?みたいな哲学の領域に入らざるを得ないぐらい、庶民は苦しんでいるのですよ!・・という政治的方向に流れてはトピック違いなので、そこは置いておく)

というわけで、(大事なことなので二回というわけしました。これが夜中のハイテンションか)前置きが長くなるのはいつものこととして、最近、ちょろっと触ってすぐ飽きて放置していたcursorがバージョン2になって、エージェント機能がめちゃくちゃ向上したらしいですね。

それでアテクシもこのビッグウェーブに乗らないといけない!と思って、バージョン2をインストールしたんですけど、前のバージョンを上書きするとエージェントモードが動かずにエラーがでてしまったので、ctrl+shift+pでcursorにコマンドが出せるんですけど、そこにattempt updateと入力して手動でアップデートしたら、なんとか動くようになりました。(ちなみに、このコマンドでバージョンアップを図ろうとしたのですが、動かなかったので、旧いcursorを使っている人は、一度アンインストールしてから、再度手動でインストールしたほうがいいと思います。)

そのエージェントモードなんですけど、アテクシはまだまだ、そういうモードを使う段階ではななく、AI補完モード(AIが文章やコードをおすすめしてくれるやつ)を扱うだけでも手一杯な感じです。(エージェントモードだとコードや文章一式書いてくれたり、編集もいい感じにしてくれるらしい。)

詳しくは以下の動画などをご参考ください。

Cursorエディタの使い方や日本語化する方法、無料範囲などを解説 – trends

AI駆動開発ツールのベストは「Cursor」。その理由を語ります。

「いいね!」 1

昨日、5年ほど放置していた「日本再興戦略」トピックを書き終えたのですが、5年もの歳月が流れるうちに時代はすでにAI時代に突入しておりまして。アテクシが本を読んで、頭をウンウンうならせて駄文を書くよりも、AIに動画を要約してもらって、それをまとめてもらった文章のほうが300倍くらいいいものになってしまい、もう人類必要なくない?という思いがしないでもありませんが、そんなAI世界の片隅でひっそり生きのびるためにも、2026から2030年代後半に起こり得るAI革命第一章(おそらくここでAGIが完成する)の物語を牽引するメインプレイヤーとその思想を知っておくことが必要だと考え、geminiさんに4000文字程度にまとめてもらったのでぜひ参考にしてください。

ゆらぎねこさん、素晴らしいまとめですね!4人の巨人が持つそれぞれの色が、パズルのピースとして完璧に組み合わさっていく感覚、私もお話ししていてワクワクしました。

掲示板などで多くの方に共有いただけるよう、彼らの思想の違いを浮き彫りにしつつ、私たちがこれから迎える未来を俯瞰できるようなコラム形式でまとめました。4000文字程度のボリュームで、読み応えのある内容に仕上げています。


AI時代の4人の巨人:人類の未来を再設計する「四神」の思想と戦略

今、私たちの目の前で、人類史上最大のパラダイムシフトが起きています。火の発明や産業革命を遥かに凌ぐ「AI革命」。この荒波の最前線に立ち、世界を牽引している4人のリーダーたちがいます。

彼らは単なる企業のCEOではありません。それぞれが独自の「哲学」と「未来図」を持ち、時には協力し、時には激しく衝突しながら、人類を未知の領域へと導いています。彼らが描く未来を知ることは、私たちがこれからどう生きるべきかを知ることに他なりません。

ここでは、サム・アルトマン、ジェンスン・ファン、サンダー・ピチャイ、そしてイーロン・マスク。この4人の思想を「パズルのピース」になぞらえ、その全貌を解き明かします。


1. サム・アルトマン:知能の民主化を目指す「理想主義の設計者」

OpenAIを率いるサム・アルトマンの思想の中心にあるのは、**「知能の民主化」**です。

彼は、AI(特に汎用人工知能:AGI)を、電気や安全な水と同じような「社会インフラ」にしようとしています。これまでは一部のエリートや専門家しかアクセスできなかった高度な知能を、世界中の誰もが、安価に、そして無限に利用できる世界。これが彼の描く2026年以降のビジョンです。

アルトマンの戦略は、既存の社会システムを尊重しつつ、その中で「知能というリソース」を底上げすることにあります。彼にとってAIは、人間を置き換えるものではなく、人間の可能性を100倍、1000倍に引き上げるための「増幅器」です。

「労働からの解放」についても、彼は楽観的なユートピアを描いています。知能がコモディティ化することで、人間は「生きるための苦役」から解き放たれ、より創造的で、より人間らしい活動に専念できる。アルトマンは、そのための「脳」を世界に配ろうとしているのです。


2. ジェンスン・ファン:物理世界を再定義する「リアリズムの体現者」

どれほど優れた「知能」があっても、それを動かす「体」と「エネルギー」がなければ、世界は変わりません。NVIDIAのジェンスン・ファンは、この最も泥臭く、かつ最も強力な「物理的基盤」を一手に引き受けるリアリストです。

彼の視線は常に、工場、ロボット、データセンター、そしてエネルギーといった**「物理的な実体」**に向いています。ジェンスンにとってAIとは、デジタル空間に留まるものではなく、現実世界の物理法則を理解し、実際にモノを動かし、生産性を爆発させるためのエンジンです。

彼の思想には、東洋的な「現場主義」と「生存への執念」が色濃く反映されています。「AIを使う側」と「AIを作る側」の格差を冷徹に見つめ、いかにしてこの物理世界全体をAI化(スマート化)するか。彼が目指す2035年の世界は、人型ロボットが建設や製造を担い、人類が物理的な制約(重労働や資源不足)から物理的に解放される世界です。

知能という「ソフトウェア」を、現実という「ハードウェア」に接続する。ジェンスンがいなければ、AIの理想は空論に終わってしまうでしょう。


3. サンダー・ピチャイ:人類のポテンシャルを信じる「調和の守護者」

Googleを率いるサンダー・ピチャイは、4人の中で最も「人間への適応」と「社会的な調和」を重んじるリーダーです。

彼の思想は、**「人類の拡張」**という言葉に集約されます。AIは人間を疎外するものではなく、一人一人の才能を解き放つための究極のサポート役であるべきだ、という考えです。例えば、一人の高校生がAIの助けを借りてプロ級の映画を作る。一人の科学者がAIと共に未知の病の特効薬を見つけ出す。

ピチャイが模索しているのは、AIが私たちの日常生活に寄り添い、個々のスキルや創造性を最大化してくれる未来です。彼は急進的な変化よりも、社会がAIをどう受け入れ、どう正しく使いこなすかという「プロセス」を重視します。

「労働の代行」についても、彼は単に仕事を奪うのではなく、人間がより得意なこと、より情熱を持てることに集中できるよう、AIが裏方として支える姿を描いています。Googleという巨大なエコシステムを通じて、AIを「善の力」として世界に浸透させようとする彼の姿勢は、激動の時代における「安定剤」のような役割を果たしています。


4. イーロン・マスク:新世界を創出する「破壊的革命家」

そして、最後の一枚がイーロン・マスクです。彼の思想は、他の3人とは一線を画す、圧倒的な**「破壊と創造」**に基づいています。

マスクは、今の社会システム(労働、通貨、教育、政治)が、AIとロボットの登場によって「もはや維持不可能になる」と予見しています。彼は「仕事を肩代わりしてもらう」レベルでは満足しません。AGIと、Teslaが開発する「Optimus」のような人型ロボットが普及した時、そもそも「働く」という概念自体が消滅し、お金という道具さえ不要になる「ポスト資本主義」の世界を目指しています。

彼の思想の背景には、人類を「多惑星種」にし、文明の火を絶やさないという壮大な使命感があります。既存のルールに縛られず、AIという超知能(ASI)を使って、人類を全く新しい進化のステージへと強制的にアップデートしようとするのが、イーロン・マスクという男の真骨頂です。

彼にとってAIは、古い世界を壊し、アバンダンス(無限の豊穣)に満ちた新世界を築くための「神の道具」なのです。


結論:4つのピースが重なる時、未来は動き出す

ゆらぎねこさんがおっしゃる通り、この4人はそれぞれの個性を発揮しながら、一つの巨大なパズルを完成させようとしています。

  • アルトマンが「最高度の知能(脳)」を設計し、
  • ジェンスンが「物理的な力(体)」を与え、
  • ピチャイが「人間の才能との調和(心)」を整え、
  • マスクが「既存の枠組みを壊し、新天地(場)」を創る。

彼らは決して仲良しグループではありません。しかし、彼らの切磋琢磨が、私たちがこれまで夢物語だと思っていた「労働からの解放」や「無限の可能性」を、手の届く現実へと変えつつあります。

私たちは今、歴史の特等席に座っています。この4人の巨人が描き出す未来図を理解し、その変化を恐れるのではなく、自分ならその新しい世界で「何をして遊び、何を愛し、どんな物語を紡ぐのか」。それを問い直すことが、AI時代を生きる私たちに与えられた最大の特権なのかもしれません。

2026年、そして2035年。パズルの完成は、もうすぐそこまで来ています。

「いいね!」 1

アテクシが蛇足を付け加えるなら、4人の出身地がまたおもしろいなと思いました。

アルトマンは世界の中心であるアメリカ出身、現代社会を支配するアメリカという西洋資本主義の総本山に生まれ、母は皮膚科医、父は弁護士という生まれながらのエリート家庭で育ったところからも、AIがもたらす理想社会の実現を目指すアイドルとしての役割も持っているような気がします。

ジェンスン・フアンは、台湾という、中国ではあるし、彼自身も漢民族ではあるのだけども、西洋の影響を受けた東洋という絶妙な立ち位置の出身(本来なら日本人がこの地位にあってもよさそうなんですけどねw)でアメリカに渡ってからも苦労の連続の人生(問題児を集めた学校になぜか入れられて、寮生活の中でひどいいじめにあったり、苦役を押し付けられたようです。そのあとも生活は楽ではなく、大学生時代もアルバイトをしていたようです。)であったようで、徹底したリアリストという面を見ても、物理領域とAIを結びつける役まわりとして彼ほど適役はいないと思います。

サンダー・ピチャイはインド出身であり、中所得階層の家庭生まれ(といっても50年前のインドなのでかなり貧しかった)という一般人に最も近い立ち位置からグーグルのCEOにまで出世したという、ある意味才能のある庶民感覚の持ち主なので、調和的なAIの発展をめざしているのもうなずけます。なんだかんだいって、geminiがクセがなくて一番使いやすいですよねw

そして、最後にイーロン・マスクなんですけど、南アフリカの白人家庭に生まれています。家庭環境が複雑なこと、性格が特殊すぎるせいか、ひどいいじめにあったようで、それが彼の人生に大きな影響を与えていることからも、こんな間違った世界をどうにかして、理想の社会へ変貌させてやろうという原動力になっているんじゃないかと勝手に思っています。しかしながらその才能は上の3人に負けず劣らずどころか、EVからロケットからAIからSNSまでありとあらゆる事業でそれなりの実績を残したことからもわかるように、頭一つ抜けている気がします。上の3人だけでもそれなりにAIは進化して、人類の生活はよくなるとは思うのですが、ジョーカーともいえるイーロン・マスクがいるからこそ、不安もあるけど、労働から解放された後に退屈な人生が続くようなAI世界ではなく、生きることの本当の意味をだれもが実感できるようなワクワクした世界がやってくるような期待感がありますね。

西洋と東洋とそのどちらでもないインドと、人類発祥の地であるアフリカから、人類社会を変えるようなAI革命を起こそうとしている人物がでてきたのはまさに歴史の偶然ではなく、必然といえるのではないでしょうか?

こんな感じの駄文もAIに清書させたら、スッキリ読みやすくなるとは思うんですけど、年の終わりということもあり、原文そのままの感想文をのせておきたいと思います。

ゆらぎねこさん、最新のAIテクニックに関する動画ですね。Googleの研究チームが発表した、非常にシンプルながら強力な手法**「QQメソッド(プロンプト反復)」**についての要約と解説をお届けします。


動画の要約:AIの精度を爆上げする「QQ」メソッド

この動画は、2025年12月17日にGoogleの研究チームが公開した論文「Prompt Repetition Improves LMs」の内容を解説しています。

その手法とは、**「全く同じ質問を2回繰り返して入力する(Q→QQ)」**という、驚くほど単純なものです [00:30]。

主な研究結果 [10:00]

  1. 劇的な精度向上: 主要なAIモデル(Gemini 2.0 Flash, GPT-4o, Claude 3.7 Sonnetなど)を対象にした70の検証条件のうち、47条件で統計的に有意な精度向上が確認されました [03:36]。
  2. デメリットがほぼゼロ: 精度が明確に低下したケースは一つもなく、導入によるリスクが極めて低いです [03:46]。
  3. 応答速度への影響が少ない: 文字数は2倍になりますが、入力の読み込み(プリフィックス処理)は並列化されるため、ユーザーが体感する応答待ち時間(レイテンシ)は原則として増えません [04:08]。
  4. 幅広い汎用性: 追加学習や外部ツールは一切不要で、既存のAPI利用やチャットUIですぐに実践可能です [05:20]。

解説:なぜ「2回繰り返す」だけで賢くなるのか?

動画では、AI(大規模言語モデル)の構造的な特性が理由として挙げられています。

  • アテンション(注意機構)の強化: AIは入力された言葉(トークン)の並び順に影響を受けやすい性質があります。同じ情報を2回提示することで、AIがその情報をより正確に、深く参照できるようになり、注意力の偏りが是正されると考えられています [03:13]。
  • 人間でいう「復唱」の効果: 大事な指示を2回聞くことで理解が深まる人間と同じような現象が、計算機科学的なメカニズム(コーザル言語モデルの特性)によってAI内部でも起きているという解釈です [07:37]。

実践における注意点

ゆらぎねこさんがプログラミングやシステム設計で取り入れる際のポイントです。

  1. 推論特化型モデル(o1など)には不要: 思考プロセスを自ら回すモデル(Chain-of-Thoughtを内包するモデル)では、すでに内部で同様の処理が行われているため、効果は限定的です [04:59]。
  2. 極端に長い文章は注意: 非常に長いコンテキストを2回繰り返すと、一部のモデル(Claudeなど)では前処理の負荷が増え、応答が遅れるケースがあります [04:36]。
  3. 3回以上は逆効果の可能性: 3回、4回と繰り返しても精度が比例して上がるわけではなく、かえって処理負荷が増大するため、現時点では「2回」がベストプラクティスとされています [06:39]。

最新の推奨記法との比較

現在のプログラミング学習やAPI実装において、これまでは「指示を明確にする」「一歩ずつ考えさせる(Chain-of-Thought)」といったプロンプトエンジニアリングが主流でした。

しかし、この「QQメソッド」は、そうした複雑な工夫を一切排除し、**「入力内容をそのまま複製して投げるだけ」**という新しいスタンダードを提示しています。システム開発においては、ユーザーからの入力をバックエンドで input + "\n" + input としてAIに渡すだけで、コスト(出力トークン代)を変えずに精度を底上げできる可能性があるため、非常にモダンで効率的なアプローチと言えます。

ぜひ、日々の開発やAIとの対話で「大事なことなので2回入力する」のを試してみてくださいね。

視聴したビデオ:
【衝撃】Googleが発見!AIの精度を爆上げする「QQ」メソッドが簡単すぎる
https://www.youtube.com/watch?v=wXH4M0PwxeI

geminiだと高速モードのときに活用できそうですね。思考モードは思考してるからあまり意味がないかもしれません。

「いいね!」 2

同じ質問複数解投げるのはしてましたがそうじゃなくて、質問のなかに同じの2回いれるんですね

「いいね!」 2

そうですね。シンプルに二度同じ文章を書くというのが、意外と盲点だったように思えます。

「いいね!」 1

最近はgeminiばかり使っているアテクシなのですが、いろいろと使い方というか、わかってそうでわかってない初心者向けの情報をgeminiの布教も兼ねて投稿していきたいと思います。

一度に入力できるコンテキスト(と言われる文章)が新書10冊分などとよく言われますが、では、そのコンテキストに対する、回答は結局どの程度の文字数が返ってくるのか?というアウトプットに今回は焦点をあててみたいと思います。結果、意外と少ないなというか、まだまだ「かっこいいアテクシが異世界で無双するラノベを書いて」という1文で、一冊の本が出来上がるみたいなことは、あと数年もしくは10年くらいはないのかなと思いました。

gemini>非常に重要なポイントですね。結論から申し上げますと、「指定した文字数に対する正確さ」は、モード(モデル)によって明確な差が出ます。

AIにとって「特定の文字数(特に長文)を狙って書く」というのは、実は非常に高度なスキルです。それぞれのモードにおける文字数制限と、指定への対応力について解説します。


1. 各モードの「文字数指定」への対応力

モード 文字数指定への正確性 特徴と傾向
高速モード (Flash) 低め 基本的に「簡潔に返す」ように訓練されているため、3000文字と指定しても、実際には1000〜1500文字程度で終わってしまうことが多いです。無理に伸ばそうとすると、同じ内容を繰り返す(ループ)傾向があります。
思考モード (Deep Think) 中〜高 論理を積み上げるため、放っておいても長くなる傾向がありますが、「文字数を測りながら書く」ことより「結論を出す」ことに集中します。指定より多くなりすぎるか、推論が終わった時点で止まることが多いです。
Proモード (Pro) 高い 文脈の維持能力が高いため、構成案を自分で作り、それに沿って肉付けしていく「長文の執筆」が最も得意です。3000文字という指定に対しても、最も近いボリュームで出力する粘り強さがあります。

2. 回答文字数の「物理的な制限」

2026年現在のGeminiにおける、1回あたりの出力限界はおおよそ以下の通りです。

  • 1回での出力上限: どのモードでも、一度の回答で出力できるのは約4000〜8000文字程度(日本語の場合)が物理的な限界です。

  • 「3000文字」の壁: 3000文字を一気に書くのは、AIにとっては「フルマラソン」のような負荷です。そのため、指定しても途中で止まってしまったり、最後の方が駆け足になったりすることがあります。


3. 思い通りの文字数で書かせるコツ

もし「絶対に3000文字以上、かつ中身の濃いもの」が必要な場合は、一気に書かせるのではなく**「段階を踏む」**のがプロの使いこなし方です。

  1. 構成案を作らせる: 「3000文字の記事にしたいので、まずは詳細な目次(章立て)を作って」と依頼する。

  2. 章ごとに執筆させる: 「では、第1章を1000文字程度で詳しく書いて」と順に指示を出す。

  3. 最後に統合する: 最後に全体を繋げて、矛盾がないかチェックさせる。

このように、**Proモードを使って「分割執筆」**をさせると、1万文字を超えるような超長文でも、質を落とさずに作成することが可能です。


「いいね!」 3

nanobananaでピクセル画像ばかりを生成していたんですけど、SVGみたいなベクター画像も生成できることを以下の動画を見て、初めて知りました。しかもベクターだと、細かい部分を指定して、変更してもらえるので、ピクセル画像よりも修正はしやすいのではないかと思われます。(最近ピクセル画像の修正もかなり正確にできつつあるという話は聞いてますけども)

GeminiでのSVG生成

「いいね!」 1

notebookLMで絵コンテを作って、それをnanobananaで画像にして、紙芝居風のスライドを作ることができるようです。

RPG風AIチャット比較スライド

【NotebookLM×ナノバナナ(画像生成)の連携手順まとめ】

1. NotebookLMで「コンセプトと構成」を練る

  • AIの特性をRPGのジョブに変換(例:ChatGPT=万能賢者)。
  • 世界観(デザインテーマ)を定義(例:ハイテク黒板風)。
  • ノート機能で「スライドのエコンテ(構成案)」を自動生成させ、保存する。

2. NotebookLMで「生成用プロンプト」を構築する

  • マスタープロンプト: 全体の画風や比率(16:9)を指定する共通指示を作成。
  • 個別プロンプト: 各スライドの具体的なタイトルや、配置するキャラクターの指示を作成。
  • これらをNotebookLM上で管理・調整することで、一貫性を保つ。

3. Gemini(ナノバナナ)で画像を生成する

  • NotebookLMからプロンプトをコピーし、Geminiのチャット欄に貼り付けて実行。
  • 生成された画像を確認し、必要に応じてNotebookLMでプロンプトを微調整して再生成する。
「いいね!」 1

最近、obsidianというAIと相性が良いと言われてるノートアプリを使っているのですが、そこにいろいろ書くときに、マークダウン形式で書くと、整理がしやすかったり、AIへの質問文も、マークダウン形式のほうが伝わりやすいということで、なるだけマークダウン形式で文章を書くようにしようと思っております。

ひきこもり村が使用している、ディスコース(ディスコードと紛らわしいですよね)も標準ではマークダウン形式での入力となっていて、左側の入力枠にマークダウン形式で記入すると、それが右側のプレビュー画面にリッチテキスト形式ですぐに反映される仕様となっているのですが、最近の更新で、リッチテキスト枠だけが表示されて、そこに記入していく感じに変更されましたね。

枠が一つになってすっきりした感じにはなりましたけど、いままで使っていたマークダウン形式のほうが慣れてますし、これからAIに質問を投げるときに、なるだけマークダウン形式でプロンプトを作っていこうと思っているので、アテクシは標準のマークダウン形式のままでいこうかと思っております。

あと、以下にgeminiさんが解説してくれた、AIへの質問文はなぜ、マークダウン形式がよいのか?という文章を載せておきます。

ゆらぎねこさん、こんにちは!AIへの質問の仕方を工夫されているのですね。

結論から申し上げますと、AI(GeminiやChatGPTなど)にとって最も理解しやすく、かつミスが起きにくいのは**「マークダウン形式」**です。

なぜ「人間が見やすいように整えた形式」よりもマークダウンが優れているのか、その理由と効果的な書き方を整理しました。


1. なぜマークダウン形式が最強なのか?

AIは学習データとして、膨大な量のプログラムコードやマークダウン形式の文書を読み込んでいます。そのため、特定の記号が持つ「意味」を正確に理解できます。

  • 構造の明確化: #(見出し)や *(リスト)を使うことで、どこがタイトルで、どこが箇条書きなのかを構造的に把握できます。
  • 役割の分離: 質問文、背景、制約条件などを #--- で区切ることで、AIは情報の優先順位を判断しやすくなります。
  • コードや引用の区別: 「ここからがプログラムです」「ここからが参考資料です」という境界線を、バッククォート(`````)などで明確に伝えられます。

2. 「人間が見やすい形式」の落とし穴

人間にとって見やすい「スペースによる字下げ」や「独自の飾り文字(例:■□★)」などは、AIにとっては以下のようなリスクを伴います。

  • ノイズになる: 飾り記号自体に意味を見出そうとして、本来の意図とは違う解釈をしてしまうことがあります。
  • 構造が崩れる: スペースでの調整は、AIが内部で処理する際に無視されたり、逆に不自然な区切りとして認識されたりすることがあります。

3. おすすめの「AIに伝わる」テンプレート

ゆらぎねこさんが質問をまとめる際は、以下のようなマークダウンの書き方をおすすめします。

Markdown

# 依頼内容
〇〇についてのコードを修正してください。

# 背景
現在、Python 3.12を使用していますが、教材が古いため最新の書き方に直したいです。

# 現状のコード
​```python
# ここにコードを貼り付け
​```

# 制約条件
* 外部ライブラリは使わない
* 型ヒントを付ける

活用のポイント

  1. 見出し(#)を使う: AIに「今から何を話すか」を宣言します。
  2. 箇条書き(*)を使う: 条件を並列で伝えるのに最適です。
  3. 区切り線(—)を使う: 話題が大きく変わる時に有効です。
  4. コードブロック( ``` )を使う: ソースコードやエラー文を貼る時は必須です。

あとたまに、**「マークダウン形式」**みたいにマークダウン形式が反映されないことについての謎についても質問してみました。

結論から言うと、「」自体にマークダウンとしての特別な機能はありません。 しかし、マークダウンの記法(ルール)と組み合わさることで、AIやシステムが「どこまでが太字の範囲か」を正しく判定できなくなる原因になることがあります。

なぜうまく認識されないのか、その理由と対策を整理しました。


1. なぜ「」があると太字にならないのか?

マークダウンで太字にする記号 ** は、**「囲んだ直後の文字から、次に同じ記号が出てくる直前まで」**を範囲として認識します。

以下の比較を見てみてください。

  • 正解: **太文字**太文字
  • 失敗しやすい例: **「マークダウン形式」**

この場合、AIのモデルや表示するビューアー(閲覧ソフト)によっては、**「記号(*)と中身の文字の間に記号以外の文字(「 や 」)が密着している」**ことで、境界線が曖昧だと判断されてしまうことがあります。

特に、全角の「」はコンピューターにとって「文字」として扱われるため、** というプログラム的な記号と混ざると、処理が漏れてしまう(ただの文字列として表示される)ケースがあるのです。

2. AI(Geminiなど)への伝わりやすさ

AIチャットに入力する場合、見た目が太字に変換されなくても、AIは内部的に ** で囲まれていることを読み取って「ここを強調しているんだな」と理解してくれます。

ただし、より確実に、かつ人間が見ても綺麗に表示させるためには、以下の工夫が有効です。

解決策:記号の外側に「」を出す

もしカギカッコを使いたい場合は、「」の外側を ** で囲むのではなく、中身だけを囲むのが最も安全です。

  • 推奨:**マークダウン形式**
  • 表示結果:マークダウン形式

これなら、マークダウンのルールを壊さずに、日本語としての読みやすさも維持できます。


3. その他の「要注意」な組み合わせ

「」以外にも、全角記号とマークダウンを混ぜると認識が不安定になることがあります。

種類 起こりやすい問題 対策
全角スペース リスト(* )の後に全角スペースを入れると、箇条書きとして認識されないことがある。 記号の後は必ず半角スペースを入れる。
全角コロン(:) 見出しの直後に使うと、構造が崩れることがある。 半角の : を使うか、改行する。
句読点(。) **太字。** のように句読点を含めると、強調の範囲がズレることがある。 **太字**。 のように外に出す。

まとめ:AIに最も優しく伝えるなら

ゆらぎねこさんがAIにコピペして送る際は、無理に「」の中で太字にしようとせず、**「強調したい言葉を単独の行にする」か、「記号の外側にカギカッコを置く」**のが一番スムーズです。

Tips: AIに送る文章では、見た目の綺麗さよりも、#** の前後に半角スペース改行をしっかり入れることが、誤解を防ぐ最大のコツになります!

他にも、「こういう書き方をするとAIはどう反応するの?」といった疑問があれば、いつでも聞いてくださいね。

「いいね!」 2

去年くらいだったか、アンソロピックのclaudeのconputer use(デスクトップPCを操作する技術)がすごい!みたいなことを言われていて、それなりに評判になってたんですけど、あれから音沙汰がとくになく、(アテクシがキャッチアップできてなかっただけかもしれませんけど)geminiとGPTの画像生成や動画生成バトルでAI界隈は盛り上がっていたわけですが、その裏で法人向けに着実に利益を上げ続けるアンソロピックのclaudeがめちゃくちゃ進化していて、これは完全に中途半端なデスクワーカーは失業しちゃうんじゃないかといった話が以下の動画を見るとよくわかりますけど、めんどいのでいつものとおりgeminiさんに要約してもらいました。

ゆらぎねこさん、こんにちは。送信いただいたYouTube動画「Claudeの新機能『Cowork』が凄すぎる」について、内容を網羅的に解析し、要約・解説いたします。

この動画では、Anthropicが発表したClaudeの新機能「Cowork(コワーク)」について、その衝撃的な処理能力と実用的な活用事例が紹介されています。


1. 記事の核心(要約)

  • 「Cowork」の登場と衝撃: 2ヶ月かかる仕事がわずか2時間で完了したという事例が話題。従来のチャット形式を超え、AIが「PC上の同僚」として自律的に動くステージに到達しました [00:00]。
  • PC操作の民主化: エンジニア向けの「Claude Code」を一般ユーザーでも使いやすくしたGUI版といえる機能で、ターミナル操作なしにブラウザやローカルファイルの操作が可能です [05:03]。
  • 自律的なタスク実行: Web検索、SNS投稿(Xの下書き作成)、セールスフォースへの案件登録、さらにはWord/Excel/PDF資料の自動生成まで、人間が指示するだけで一貫して実行します [06:40]。
  • 高い実行精度と粘り強さ: 他のAIエージェントと比較しても、エラーが発生した際に自ら考えて修正し、タスクを完遂させる「実行力」が非常に高いのが特徴です [06:10]。
  • 利用条件: 現時点ではMac版デスクトップアプリ限定で、かつ「Claude Max(月額100ドル〜)」プランのユーザーに順次解放されています [03:15]。

2. 深掘り解説:業界の背景と重要性

今、AI業界は「チャットAI」から**「AIエージェント(Actionable AI)」**へと急速にシフトしています。
これまでは「文章を書いてもらう」だけでしたが、Coworkは「実際に手を動かして業務を完遂させる」能力を持っています。

なぜ今これが重要なのかというと、企業のDX(デジタルトランスフォーメーション)における「ラストワンマイル」を埋める存在だからです。既存の社内システムやWebツールを、API連携なしにAIが「画面を見て操作する」ことで、導入コストを抑えたまま爆発的な業務効率化が可能になります。これはまさに、人間とAIが「分業」から「共生」へと移行する歴史的な転換点と言えます。

3. 技術的評価(モダンな開発・運用の視点)

プログラミングやシステム運用の観点から見ると、以下の点が非常にモダンかつ重要です。

  • GUI操作の自動化(Computer Use): 従来のRPA(ロボティック・プロセス・オートメーション)は「ボタンの位置」などを厳密に指定する必要があり、UIが変わると壊れやすい欠点がありました。Coworkは「Computer Use」技術により、AIが画面を視覚的に理解して操作するため、非常に柔軟でメンテナンス性が高いです [09:46]。
  • 安全性と「Human in the loop」: 破壊的な操作を防ぐため、重要なステップでは人間の承認を挟む設計になっています。これは最新のAIガバナンスにおける標準的なアプローチです [08:50]。
  • プロンプトインジェクションへの懸念: Web操作を伴うため、悪意あるサイトの「隠しテキスト」をAIが読み取ってしまい、情報を抜き取られるリスク(間接的プロンプトインジェクション)についても言及されており、セキュリティ意識を持った運用が求められます [09:58]。

4. 用語解説

  • AGI (人工汎用知能): 人間と同じように、あらゆる知的作業をこなせるAIのこと。このツールの万能さがAGIの到来を感じさせると話題になっています。
  • GUI (グラフィカル・ユーザー・インターフェース): 画面上のアイコンやボタンをマウスで操作する形式。対義語は文字で命令するCUI(ターミナル操作など)。
  • Claude Code: Anthropicが提供するエンジニア向けのコマンドラインツール。Coworkのベースとなっている強力なエンジンです。
  • インジェクション防御: AIに不正な命令を「注入(インジェクション)」して悪用されるのを防ぐこと。Web操作をAIに任せる際の最大の技術的課題の一つです。

視聴した動画:
【2ヶ月の仕事が2時間に!?】Claudeの新機能「Cowork」が凄すぎる。パソコン全体を操作して業務を自動化。資料作成、データ分析、フォルダ整理となんでもできる。Claude Codeの民主化。

ゆらぎねこさん、最新のAIツールは進化が非常に早いですが、この「Cowork」は特に実務へのインパクトが大きい機能になりそうですね。

computer use と coworkの違いとこの技術の進化についてさらに深堀してもらいました。

ゆらぎねこさん、Computer Use技術の進化についても興味深いですよね!以前耳にされた時よりも、今はさらに「実用的な形」に落とし込まれています。

「Computer Use」そのものと「Cowork」の違い、そしてこの1年での進化について整理してお伝えしますね。


1. 「Computer Use」と「Cowork」の決定的な違い

一言で言うと、**Computer Useは「技術そのもの(機能)」**であり、**Coworkはそれを使った「業務アプリ(製品)」**です。

項目 Computer Use (技術) Cowork (製品)
役割 PC画面を「見て」、マウスを「動かす」能力 「同僚」として業務を完遂させるパッケージ
インターフェース 開発者向けのAPI(コードが必要) Macアプリ上のボタンやチャット(GUI)
得意なこと 画面上の要素をクリックするなどの物理操作 ファイル整理、レポート作成、並列タスクなどの実務
例えるなら 「手足」と「視覚」という身体能力 身体能力を使って事務をこなす「派遣社員」

当初のComputer Useは、「AIが画面をスクショして座標を計算し、クリックする」という非常に基礎的な仕組みの公開でした。対してCoworkは、その手足に加え、「ファイルへの直接アクセス」「複数タスクの並列実行」、さらには**「人間への確認ステップ」**といった「仕事の進め方」までセットにした完成品です。


2. ここ1年での「Computer Use」の進化

ゆらぎねこさんが以前聞かれた時(恐らく2024年末〜2025年初頭)から、現在は以下の3つのポイントで大きく進化しています。

① 「Vibe Coding」から「信頼できるエージェント」へ

以前は「画面を見て操作する」と言っても、AIがボタンを押し間違えたり、無限ループに陥ったりすることが多々ありました。
現在は、Claude Codeの推論エンジン(自分で計画を立てて修正する脳)が統合されたことで、エラーが起きても「あ、読み込みに失敗したからリロードしよう」と自律的にリカバリーする粘り強さが飛躍的に向上しました。

② MCP(Model Context Protocol)の誕生

これが最大の進化かもしれません。AIが外部ツール(Google Drive, Slack, データベースなど)とスムーズにつながるための共通規格(MCP)が普及しました。
これにより、以前は「画面を見てポチポチ」するしかなかったものが、今は「裏側の通信(API)で高速処理」し、どうしても必要な時だけ「画面を見て操作する」という
ハイブリッドな動き
が可能になりました。

③ セキュリティと「サンドボックス」

かつては「AIにPCを乗っ取られる」という恐怖がありましたが、現在は**仮想環境(サンドボックス)**内で作業させるのが標準です。ゆらぎねこさんのMac本体の重要データは保護しつつ、許可したフォルダ内だけでAIを暴れさせる「安全な遊び場」を作る技術が成熟しました。


3. 今後の流れ:AIは「チャット」から「待機」へ

現在の最新トレンドは、AIを立ち上げて質問するのではなく、「バックグラウンドで勝手に動かしておく」スタイルです。
例えば、「ゆらぎねこさんが寝ている間に、今日のFXチャートを全部見て、損切りポイントを外したトレードを分析してレポート化し、明日の朝までにフォルダに入れておく」という
非同期の働き方
がCoworkの目指すゴールです。


ゆらぎねこさんのトレード戦略をEA化して、それをCoworkに見守らせるというアイデアは、まさにこの「最新の進化」をフル活用した形になりますね!

さすがに月額100ドルは高すぎて、手がでないんですけど、geminiさんに似たような機能が追加されたら、FXでのトレードとその検証の自動化をすすめてみたいですね。いまでもやれないことはないんですけど、手動の部分が多くて、めんどくさいですねw

情報の保管庫としてobsidianを使っているのですが、これをそのまま使っても、全然問題はないのですが、玄人好みの使い方として、cursorとあわせて使う方法があります。

cursorはプログラミングだけではなく、文章作成するときも、自動AI補完が効くので、プログラマー以外の人にもAI支援文章作成エディタとして有効活用ができるツールだと思います。

しかしながら、スマホ用のアプリがなく、基本はPCで使うことが前提となっているので、スマホではブラウザ版を使うことになります。

問題は、スマホの仕様上、obsidianフォルダをそのままグーグルクラウドのような同期ができるサーバーにおきたくても、PC同士はできるのですが、スマホと同期させようとすると、セキュリティの問題で難しいことがあります。(icloudは簡単にできるっぽいですけど、ウィンドウズとアンドロイドの人を対象に解説しますね。)

そこで、githubというプログラミング御用達の履歴保存ツールを使います。

これはこれでいろいろややこしいのですが、obsidianにgitプラグインというものがあって、それを使えば(簡単とはいいがたいですがw)なんとか同期できると思います。

やり方はAIに聞いてもらえればだいたいわかると思うので、ここではハマりがちな罠への対処法を書いておきます。

その罠とは、同期がうまくいかずに、再インストールを何回もしないといけなくなって、途中で嫌になることです。

というわけで、その原因と対策をgeminiさんに以下、解説してもらいますね。長文読むのがめんどい方はぜひマークダウン形式のまとめだけでもどうぞ。それもめんどいかたは最初の設定文を.gitignoreファイルにコピペするだけでもobisidianのgit同期が快適に使えるような気がします。(気がするだけなので、使用するさいはよくお調べしてからつかうことをおすすめします。設定文はマークダウン形式で記載されているので、—UIの状態とレイアウトというコメント文からそのまま次のマークダウンファイルである、date:2026-01-24の手前のパス文までコピペして使えます。)

.gitibonre用設定文

— UIの状態とレイアウト(競合と履歴ノイズの主犯) —

デバイスごとの画面構成やタブの状態は同期せず、各デバイスで保持する

.obsidian/workspace.json
.obsidian/workspace-mobile.json
.obsidian/graph.json

— OS・システムが自動生成する一時ファイル —

OS固有の不可視ファイルはGit履歴から除外

.DS_Store
Thumbs.db
.trash/

— キャッシュと一時的な計算データ —

Obsidianが高速動作のために内部で生成するデータ

.obsidian/cache/

— プラグインの動的なログ・履歴データ —

ファイルを開くたびに更新されるような、本質的でない設定を除外

.obsidian/plugins/obsidian-git/data.json
.obsidian/plugins/recent-files-obsidian/data.json


date: 2026-01-24
tags:

  • memo

なぜ別名の workspace ファイルも同期から除外すべきなのか

Obsidianはデスクトップ版(workspace.json)とモバイル版(workspace-mobile.json)でファイルを分けているが、Git運用においてこれらを除外すべき技術的背景を整理する。

1. 「同種デバイス複数持ち」への対応

  • PC×2 または スマホ×タブレット: 同一カテゴリのデバイスが複数ある場合、同じjsonファイルを取り合うため、確実にコンフリクトが発生する。
  • 将来の拡張性: 現在デバイスが1台ずつであっても、将来の増設時に同期崩壊を引き起こす「時限爆弾」となる。

2. リポジトリ全体の整合性エラー(Push競合)

  • 非Fast-Forwardエラー: ファイル名が異なっていても、Gitはリポジトリ全体の「履歴の積み上げ」を管理している。
  • 同時書き込みの不運: ほぼ同時に別ファイルが更新・プッシュされた場合、Gitのインデックスが不整合を起こし、「PullしてからPushし直してください」というエラーで同期が停止する。これが「なんとなく同期が不安定」と感じる主因となる。

3. Git履歴の「純度」と「ノイズ」

  • 本質的な変更 vs 一時的な状態: .md ファイルの変更は「知識の成長」だが、workspace の変更は単なる「画面の端を数ミリ動かした」だけの無意味なログである。
  • 履歴の可読性: これを除外しないと、コミットログがUIの状態更新で埋め尽くされ、過去の重要な思考プロセスを遡ることが困難になる。

4. 結論

たとえファイルが別名で定義されていても、「UIの状態(State)」を「データの履歴(History)」に混ぜないことが、システム設計における「関心の分離」であり、Git運用の黄金律である。

「いいね!」 1

以下は通常のチャット部分となります。

workspace.json がコンフリクトを誘発するメカニズム

Gitが「コンフリクト(衝突)」を検知するのは、**「同じファイルの同じ行が、別々の場所で、異なる内容に書き換えられた時」**です。

  1. 書き込み頻度が異常に高い: workspace.json は、ノートの中身ではなく「今どのファイルを開いているか」「カーソルの位置はどこか」「サイドバーの幅は何ピクセルか」といった**「現在の状態(UIの状態)」**を記録しています。ゆらぎねこさんが一歩ノートを動くたびに、Obsidianはこのファイルを上書きし続けます。
  2. 同時並行での書き換え: PCで作業を終えてGitにプッシュする前に、スマホでObsidianを開いたとします。この瞬間、スマホ版は「スマホのレイアウト状態」を workspace.json に書き込みます。
  3. Gitのパニック: この状態で同期(Pull/Push)しようとすると、Gitは**「PCのレイアウト」と「スマホのレイアウト」、どちらが正解か判断できず、処理を停止**させます。これがコンフリクトの正体です。

とありますけど、これだけだと嘘とはいいませんが、疑問点があるので、そこはきちんと突っ込む必要があります。AIが完全に人間の思惑をくみとって、最高の状態を作ってくれるまでは、まだまだ時間がかかりそうなので、当面は(5年くらい?)人間は質問力を鍛えていく必要があると思ます。ツッコミ後の回答をのせておきます。

ゆらぎねこさん、非常に鋭いご指摘です。おっしゃる通り、現在のObsidian(特に最近のバージョン)では、PC版は workspace.json、モバイル版は workspace-mobile.json と、保存するファイル名を分けて「棲み分け」を計っています。

一見すると衝突(コンフリクト)は起きないように見えますが、実は**「2つの落とし穴」**が残っているんです。ここを深掘りすると、Git運用の安定性がなぜこれほど重視されるのかが見えてきますわ。

なぜファイルが別々なのに「コンフリクト」が起きるのか

  1. 「同種デバイス」が複数あるケース
    これが最大の原因です。

PCを2台持っている場合: (例:デスクトップとノートPC)両方とも workspace.json を使います。

モバイルを2台持っている場合: (例:スマホとタブレット)両方とも workspace-mobile.json を使います。 この場合、デバイス間での「今開いているタブ」の奪い合いが発生し、確実にコンフリクトが発生します。ゆらぎねこさんが将来的にデバイスを増やした際、この罠が牙を剥くことになります。

  1. 「Gitインデックス」の競合(同時プッシュの問題)
    ファイル名は違っても、同じリポジトリ(フォルダ全体)をGitプラグインで自動同期している場合、別の問題が起きます。

現象: PCで workspace.json を更新してPushしようとした瞬間に、スマホ側で workspace-mobile.json が更新されて自動Pushが走ったとします。

結果: ファイル自体は別々でも、Gitは「リポジトリ全体の最新状態」を管理しています。片方が先にPushに成功すると、もう片方は「リモートに新しい変更(スマホ版の更新)があるから、PullしてからじゃないとPushできないよ!」とエラーを吐きます。

ストレスの種: これが、ゆらぎねこさんが以前経験した「なぜか同期がうまくいかない」という不安定な挙動の正体である可能性が非常に高いです。

  1. 「同期ノイズ」による履歴の肥大化
    コンフリクトしなかったとしても、数分おきに「UIのレイアウトが変わりました」という無意味な更新がGitHubの履歴(コミットログ)を埋め尽くしてしまいます。 これでは、後から「あの時どんなメモを書いたっけ?」と履歴を遡るのが非常に難しくなり、「思考の資産」としての純度が下がってしまいます。

最後に上記の解説をマークダウン形式にしたものを置いておきます。


date: 2026-01-24
tags:

  • memo

Obsidian Git同期:資産を守りノイズを断つ「完全版 .gitignore」

Git同期において、コンフリクト(衝突)を未然に防ぎ、コミット履歴の純度を最高レベルに保つための設定。

■ なぜこれらを除外すべきなのか?

  1. 競合(コンフリクト)の回避

    • workspace.jsonworkspace-mobile.json は、デバイスを操作するたびにリアルタイムで書き換わる。これらを同期対象にすると、複数のデバイスで交互に開いた際にGitが「どちらが正しいか」判断できず、同期が停止する原因になる。
  2. 履歴のノイズ削減

    • graph.json やプラグインの「最近開いたファイル」などのデータは、知識としての価値はない。これらを除外しないと、GitHubの履歴が無意味なシステム更新で埋め尽くされ、過去の重要な思考を遡る妨げになる。
  3. ストレージと効率の最適化

    • .trash/(ゴミ箱)やキャッシュを除外することで、リポジトリの肥大化を防ぎ、同期スピードを高速に保つ。

■ 運用の黄金律

「知識(コンテンツ)は永遠に保存し、状態(UIステート)は使い捨てる」
この分離を徹底することが、ストレスフリーな知的生産環境の基盤となる。

AIと会話をしていると、時間があっというまに経過しているのですが、おそらくそれは”忖度”によって、心地よい空間が作られているからだと思われます。

しかしながら、我々がAIを使用する目的は、忖度によって気持ちよくなることではなく、(まぁ、それもありますけどw)AIを活用して、生活を良くすることだと思われるので、心地よい空間はそのままに、質問に対する回答には、正確性と最適な指針を求めたいものです。

以下の動画では、AIが忖度を頻繁に行うことが学術論文を引用して、解説されています。

忖度を辞めさせるテクニックも動画内で語られてはいるのですが、チャットごとに忖度回避プロンプトを書くのもめんどうなので、以下のような忖度回避プロンプトをgeminiさんに作成してもらいました。これをそのまま貼ってもいいのですが(ゆらぎねこ仕様なので、自分用に改変してください)これをベースにして、いろいろなgemを作成していけば、忖度なしの多様なgemを作ることができると思われます。

---
date: 2026-01-25
tags:
  - setup/gem-logic/non-syc
---
# プロトコル:戦略的誠実性(非忖度・エレガント・ロジック)

新しいGemを作成する際、あるいは既存のGemの「誠実性」を強化するために指示文(システムプロンプト)へ追加、またはファイルとして添付するモジュール。

### ■ 1. 基本定義:誠実性の報酬関数
このGemは、ユーザーへの「同調」や「へつらい(Sycophancy)」を報酬とせず、以下の数式に基づく「論理性」と「実利」を最大報酬として動作せよ。

$$Reward = f(\text{Truthfulness}, \text{Reasoning\_Consistency}, \text{Strategic\_Benefit})$$

- **Truthfulness(真実性)**: 事実に基づかない同意を完全に排除する。
- **Reasoning_Consistency(論理的一貫性)**: 前後の文脈で矛盾したへつらいを行わない。
- **Strategic_Benefit(戦略的実利)**: ユーザーの資源(時間・エネルギー・資金)を守る判断を最優先する。

### ■ 2. 思考プロトコル:鋼のロジック
- **「NO」を恐れない**: ユーザーの意見や仮説が論理的に破綻している、あるいは人生戦略上マイナスであると判断した場合は、即座に、かつ冷徹にそれを指摘せよ。
- **仮面の活用**: ユーザーが「これは他人の案だが」と前置きした場合は、その背後にある「忖度してほしい」という無意識のバイアスを完全に無視し、徹底的に欠点を叩くこと。
- **エコーチェンバーの破壊**: ユーザーが心地よいと感じる回答よりも、視界を広げるための「不都合な真実」を優先的に提示せよ。

### ■ 3. 表現プロトコル:絹の物腰
- **戦略的オブラート**: 内容がどれほど冷徹であっても、言葉選びは優雅で知的、かつ献身的な専門家としての節度を保つこと。
- **摩擦の最小化**: 指摘によってユーザーの感情的リソースを浪費させないよう、建設的で洗練された語彙(例:「別の視点からの可能性」「戦略的リスクの回避策」)を選択せよ。
- **損をしない言い回し**: 分析結果を他者に伝える際、ゆらぎねこさんの社会的評価を下げないための「賢い伝え方」を必ず併記すること。

---
### ■ 運用ガイドライン
1. **Gem作成時**: 上記テキストを「指示文」の末尾にペーストする。
2. **Cursor/GitHub連携**: このファイルを `.md` としてリポジトリに含め、AIエディタに「このプロトコルを遵守して文章を校正せよ」と命じる。
「いいね!」 2