Close

Fifty years of synthesis: from FM sidebands to bin-direct addressing

A project log for FPGA Spectrum Engine

10,240 independent oscillators · 1-sample latency · 0.001 Hz resolution

tsuneoohnakaTsuneo.Ohnaka 04/30/2026 at 05:520 Comments

Synthesis Paradigm Lineage — from Chowning's FM to Razor, and where this engine sits

Build Logs #1, #2, and #4 covered, respectively, the polynomial evaluation architecture, the 2020 prototype that proved the architecture works, and the Open Prompt paradigm under which this project is released. This log places the project on the timeline of digital sound synthesis itself.

The argument is short and, I think, defensible: every major synthesis paradigm of the last fifty years is a special case of "decide what frequency, amplitude, and phase to assign to each spectral bin, and sum the results." What changed across decades was not the underlying mathematics — it was which subset of bin patterns the available hardware could actually compute in real time, and which abstractions made those subsets composable for human composers.

The FPGA Spectrum Engine is what becomes possible when the hardware no longer has to choose a subset.

A note on this log

This log is the most opinionated of the four. It situates the project in a lineage; lineages are arguments. Where the technical Build Logs (#1, #2) were careful, and the philosophical one (#4) was deliberate, this one is interpretive. Reasonable engineers and historians will disagree with parts of it. That is appropriate.

The strong claim — that all these paradigms reduce to the same problem — is mine, not the field's consensus. I make it because I think it is true, and because making it explicit lets us see what the next paradigm looks like.

1973 — Chowning's FM and the side-band epiphany

In 1973, John Chowning at Stanford published "The Synthesis of Complex Audio Spectra by Means of Frequency Modulation." The mathematical heart of the paper is the trigonometric identity that converts a frequency-modulated carrier into a sum of side-bands:

sin(ωc·t + β·sin(ωm·t)) = Σ Jₙ(β) · sin((ωc + n·ωm)·t)

The right-hand side is a spectral description. It says: to make this FM tone, place sinusoidal bins at frequencies ωc + n·ωm with amplitudes Jₙ(β), the n-th Bessel function of the first kind evaluated at the modulation index β.

If you had hardware capable of placing arbitrary bins with arbitrary amplitudes in real time, FM synthesis would be one specific bin-placement recipe. But Chowning did not have that hardware. He had a single oscillator capable of sinusoidal output and a means of frequency-modulating it. The genius of FM was that a recursive trick on the time-domain side produced the spectral richness on the frequency-domain side, with hardware barely capable of one sine wave.

The Yamaha DX7 (1983) industrialized this trick. With six "operators" — six FM-capable oscillators arranged in 32 routing topologies ("algorithms") — the DX7 could produce a vast tone palette while consuming only modest hardware per voice. The reason the DX7 could not do everything an additive synthesizer could is not theoretical; it is that FM constrained which bin patterns it could reach. Bessel-function side-bands, scaled to whatever β you chose, with carrier-frequency ratios that produced predictable spectra. Beautiful, but constrained.

FM was always a special case of bin-direct addressing. It just happened to be the special case that fit on 1980s silicon.

Late 1970s — Synclavier and Kawai K5: additive synthesis for real

While FM was conquering the consumer keyboard market, a parallel lineage at the high end was implementing additive synthesis directly: place dozens, then hundreds of partials (bins, in our terminology) at integer multiples of a fundamental, give each its own envelope, sum the result.

The New England Digital Synclavier II (1980) and especially the Kawai K5 (1987) showed that additive synthesis was possible. The Kawai K5 offered 63 harmonics per source, with each harmonic assignable to one of four six-stage amplitude envelopes; in full mode it could address 126 harmonic components.

What additive synthesis could not yet do, in this period, was place bins anywhere except at integer multiples of a fundamental. The "harmonic" assumption was hard-coded into the user interface and often into the hardware data flow. If you wanted an inharmonic spectrum — a bell, a gong, a wood block — additive synthesis as offered by these instruments could not directly express it.

Inharmonic synthesis required either (a) physical modeling, which approximates an inharmonic resonator's behavior in the time domain, or (b) wavetable synthesis with carefully crafted single-cycle waveforms whose harmonic content was already inharmonic before resampling. Neither was bin-direct addressing in the modern sense.

Additive synthesis of this era was bin-direct addressing constrained to harmonic frequency lattices. The constraint was a UI and storage decision, not a mathematical necessity. Lift the constraint, and you have something more general.

1990s — Wavetable, vector, and granular: the bin-pattern era goes underground

The 1990s saw FM and additive synthesis fade from the cultural foreground while three related techniques rose:

Wavetable synthesis stored short samples (often single cycles) at multiple keys and crossfaded between them as pitch and modulation changed. Mathematically, a wavetable's harmonic spectrum is a bin pattern — but the synthesizer treated the wavetable as an opaque black box. The user interface said "select wavetable 47," not "place these bins at these frequencies with these amplitudes." The bin-direct nature of what was happening was hidden.

Vector synthesis (Korg Wavestation, Sequential Prophet VS) blended four wavetables in two-dimensional space. Spectrally, this is interpolation among four bin patterns. Again, the underlying bin-direct structure was true but invisible to the user.

Granular synthesis (Roads, Truax, then Native Instruments Reaktor) chopped sound sources into 1–100 ms grains and recomposed them. Each grain has a spectrum. The aggregate sound is a time-varying superposition of grain spectra. This is, in effect, bin-direct addressing where the bins are themselves complex (each "bin" is a grain rather than a single sinusoid), and the addressing is statistical rather than deterministic.

These techniques were enormously productive for sound designers and composers. They were not, however, presented or understood as instances of a unified bin-pattern paradigm. The mathematics was hidden behind very different user-interface metaphors: "select waveform," "blend joystick," "scatter grains." Each metaphor felt like its own discipline.

The 1990s confirmed empirically that bin patterns are powerful, while obscuring theoretically that bin patterns are what was happening.

2011 — Native Instruments Razor: the bin paradigm comes back to the surface

In 2011, Errorsmith and Native Instruments released Razor, an additive synthesizer built in Reaktor whose explicit user interface was bin-direct.

Razor's interface displayed up to 320 partials as a real-time spectral view. The user manipulated bin frequencies, amplitudes, and animations directly. Many of Razor's signature presets are unmistakably inharmonic — bell-like, metallic, glitchy textures whose bin lattices are not simple integer multiples of a fundamental.

Razor was widely received as a breakthrough not because the mathematics was new — it had been known for decades — but because the user interface finally made bin-direct addressing the primary metaphor rather than hiding it under a "patch" or "wavetable" or "grain" abstraction. Composers who had grown up with FM synthesis found themselves doing things they could not articulate in FM terms, because they were no longer constrained to FM's slice of bin-pattern space.

Razor proved the interface case for bin-direct addressing. What it did not (and could not) prove was the hardware case at scale. Razor runs on a CPU, with 320 partials per voice as its limit. That is a remarkable number for software additive synthesis, but it is several orders of magnitude below what a spectral analysis of, say, a piano string or a marimba bar would require for full reconstruction.

Razor showed that bin-direct addressing wins when given a fair UI. The remaining question was: what happens when given fair hardware?

2010s onward — The geometric synthesis quiet revival

Polygonal synthesis (and its Bessel-coefficient generalization). A small literature explored what happens when a wave is generated by a "rolling polygon" — a virtual rotating shape whose vertex count and rotation speed determine the spectrum. The mathematics turns out to involve Bessel functions in ways that connect directly back to FM. Polygonal synthesis is, in effect, FM with a more general modulator structure, producing harmonic-stack sidebands that are themselves Bessel-weighted.

These are recognizably bin-direct paradigms. These have remained largely academic or boutique because the hardware required to render them at full spectral resolution in real time — thousands of independent oscillators with sub-Hz frequency resolution — has not been routinely available.

Where the FPGA Spectrum Engine sits on this timeline

The FPGA Spectrum Engine described in this project is, by deliberate design, the first general-purpose hardware that can realize all the above paradigms simultaneously and at scale.

10,240 oscillators, each with 0.001 Hz frequency resolution, each with independently programmable amplitude and phase, summed coherently with one-sample latency at 48 kHz. The architecture is bin-direct in the most uncompromising sense: there is no built-in assumption about what the bins should do. The user — or, more often, an upstream layer of abstraction — chooses.

What this means concretely:

FM synthesis on the engine is the bin pattern frequencies = [ωc ± n·ωm], amplitudes = [Jₙ(β)]. To play a DX7 patch, compute its sideband spectrum and write the bins. Done.

Additive synthesis is the bin pattern frequencies = [k·f₀], amplitudes = [aₖ]. To play an additive patch, write integer-multiple frequencies with arbitrary amplitudes. Done.

Polygonal/Bessel synthesis is the bin pattern with frequencies at [(kN+1)·ω₀ - n·ωₘ] and amplitudes weighted by cₖ(N)·Jₙ(kNβ) — the Bessel-coefficient generalization. Done.

Wavetable is the bin pattern obtained by FFT'ing the wavetable's single cycle and writing the resulting harmonic spectrum. Done.

Spectral fractal is the bin pattern at Cantor-set positions or 1/fᵅ-spaced frequencies. Done.

Shepard tones, physical models in their spectral form, granular average spectra, raw measured spectra of acoustic instruments — all done by writing the corresponding bin pattern.

The engine is universal in the precise sense that there is no synthesis technique known to me that cannot be expressed as a bin pattern and rendered on this hardware. The constraint that previously defined which technique fit on which hardware — the constraint that gave the field its century-long sequence of "paradigms" — is dissolved.

What changes when the hardware constraint is lifted

The history above can be retold compactly: every "paradigm" of synthesis was a clever way to project the universal bin-pattern problem onto whatever subset of hardware was available. FM projected it onto one oscillator with frequency modulation. Additive projected it onto a harmonic lattice with envelope generators. Wavetable projected it onto stored single cycles. Each projection had a name, a vocabulary, a set of canonical patches, a culture.

When the projection is no longer needed, the question changes. It is no longer "which paradigm should I use?" The question becomes "what bin pattern do I want?" The answer to that question is no longer constrained by what fits on the silicon; it is constrained only by what the human composer or the upstream algorithm can articulate.

This is the shift the FPGA Spectrum Engine is designed to make available. The engine itself is universal. The interesting work moves upstream, into the abstraction layers that decide bin patterns. The PC-layer language, the ARM-HPS scene expander, the bin-pattern generators — these are where the new compositional vocabulary will be invented.

Coupling to Build Log #4 — why this matters for Open Prompt

If the engine is the first hardware to lift the projection constraint, what happens to its design knowledge becomes consequential. Past synthesis paradigms — FM, wavetable, vector — were each developed inside specific commercial firms. Their internal know-how was largely lost or proprietary. Yamaha did not publish how the DX7's algorithm tree was implemented at the gate level, and no one needed to ask, because by the time the question was interesting, the cultural moment of FM had already passed.

The FPGA Spectrum Engine is being released differently. The architecture, the reasoning behind it, and the sample implementations are being put into the public commons via the Open Prompt three-layer scheme described in Build Log #4. This means: any engineer with a capable language model collaborator can regenerate this engine on any reasonable FPGA platform, at any time, and the design space remains open for their innovations rather than closed by my specific implementation choices.

The reason this matters is that the engine's value is not in its current implementation; it is in the bin-pattern compositional vocabularies that will grow on top of it. Those vocabularies are most likely to flourish if the underlying engine is broadly accessible and broadly understood. Open Prompt is the distribution mechanism that makes that broad accessibility structurally inevitable rather than merely intended.

In other words: the technical lineage and the distribution paradigm are the same project, viewed from different angles. The engine is what becomes possible when the bin-pattern problem is given fair hardware. Open Prompt is what becomes possible when an engineering project is given fair distribution in the LLM era. Both are removals of constraints that history had treated as natural.

What I am looking forward to

If this argument is correct, the next decade of synthesis will be defined less by new "paradigms" — there are no new paradigms once bin-direct universality is reached — and more by new compositional vocabularies built on top of the universal engine. What does it sound like to compose with bin-pattern algebras directly? With evolutionary algorithms over bin distributions? With machine-learning-discovered bin patterns optimized for perceptual properties humans had no language for?

I do not know. I expect to be surprised. The point of releasing the engine as Open Prompt is to make sure I am not the only one who gets to find out.

Coming next

This log closes the initial four-Build-Log series. Future Build Logs will follow specific developments:

Companion interactive page: https://dsohnaka.github.io/FPGA_Spectrum_Engine/ Open Prompt repository: https://github.com/dsohnaka/FPGA_Spectrum_Engine_OpenPrompt


▼ Build Log 本文(日本語版・併記用)

合成パラダイムの系譜 — Chowning の FM から Razor へ、そして本エンジンの位置

Build Log #1、#2、#4 はそれぞれ、多項式評価アーキテクチャ、アーキテクチャの動作を実証した 2020 年プロトタイプ、本プロジェクトが公開される Open Prompt パラダイム、を扱った。本ログはこのプロジェクトを、デジタル音響合成そのもののタイムライン上に位置づける。

主張は短く、私の考えでは擁護可能である:過去 50 年間の主要な合成パラダイムはすべて、「各スペクトルビンにどの周波数・振幅・位相を割り当て、結果を総和するか」という問題の特殊ケースである。 数十年にわたって変わってきたのは根底の数学ではなく——利用可能なハードウェアが実時間で計算できるビンパターンの部分集合がどれであり、それらの部分集合を人間の作曲家にとって組み合わせ可能にする抽象化がどれであったか、である。

FPGA Spectrum Engine は、ハードウェアがもはや部分集合を選ぶ必要がなくなった時に何が可能になるか、である。

1973年 — Chowning の FM と側波帯の啓示

1973年、Stanford の John Chowning は "The Synthesis of Complex Audio Spectra by Means of Frequency Modulation"(周波数変調による複合音響スペクトルの合成)を発表した。論文の数学的核心は、周波数変調されたキャリアを側波帯の総和に変換する三角関数恒等式である:

sin(ωc·t + β·sin(ωm·t)) = Σ Jₙ(β) · sin((ωc + n·ωm)·t)

右辺はスペクトル記述である。これが告げているのは:この FM 音を作るには、周波数 ωc + n·ωm に振幅 Jₙ(β)(変調指数 β で評価された第一種ベッセル関数の n 次)でビンを配置せよ、ということ。

任意のビンを任意の振幅で実時間配置可能なハードウェアがあれば、FM 合成は一つの具体的なビン配置レシピである。だが Chowning にはそのハードウェアはなかった。彼にあったのは、正弦波出力可能な単一オシレータと、それを周波数変調する手段だった。FM の天才は、時間領域側の再帰的トリックが周波数領域側のスペクトル豊かさを生み出す——一つの正弦波がやっとのハードウェアで——という点にあった。

Yamaha DX7(1983年)はこのトリックを工業化した。6 つの「オペレータ」により、DX7 はボイスあたり控えめなハードウェアしか消費せずに広大な音色パレットを生み出せた。DX7 が加算合成器のすべてを行えなかった理由は理論的なものではない;FM が到達できるビンパターンを制約していたからである。選んだ任意の β にスケールされたベッセル関数側波帯、予測可能なスペクトルを生む搬送周波数比。美しいが、制約されていた。

FM は常にビン直接アドレスの特殊ケースだった。 それがたまたま 1980 年代のシリコンに収まる特殊ケースだったというだけである。

1970 年代後半 — Synclavier と Kawai K5:本物の加算合成

FM が消費者向けキーボード市場を制覇しつつあった一方で、ハイエンドの並行系譜が加算合成を直接実装していた:数十、次いで数百のパーシャル(私たちの用語ではビン)を基音の整数倍に配置し、各々に独自のエンベロープを与え、結果を総和する。

New England Digital の Synclavier II(1980年)と、特に Kawai K5(1987年)は、加算合成が可能であることを示した。K5 は、1 source あたり 63 harmonics を持ち、各 harmonic を 4 つの 6-stage 振幅エンベロープのいずれかに割り当てる方式だった。full mode では 126 harmonics を扱えた。

この時期の加算合成にまだできなかったのは、基音の整数倍以外の場所にビンを配置することだった。「調波」前提がユーザーインターフェースに、しばしばハードウェアのデータフローに、ハードコードされていた。鐘、ゴング、ウッドブロックのような非調波スペクトルが欲しい場合、これらの楽器が提供する加算合成は直接にはそれを表現できなかった。

非調波合成には (a) 物理モデリング——非調波共振器の挙動を時間領域で近似する——か、(b) ウェーブテーブル合成——リサンプリング前にすでに調波内容が非調波であるよう注意深く作られた単一周期波形を持つ——のいずれかが必要だった。どちらも現代的な意味でのビン直接アドレスではなかった。

この時代の加算合成は、調波周波数格子に制約されたビン直接アドレスだった。 その制約は UI とストレージの決定であり、数学的必然ではなかった。制約を取り除けば、より一般的なものになる。

1990 年代 — ウェーブテーブル、ベクター、グラニュラー:ビンパターン時代の地下化

1990 年代、FM と加算合成は文化的前景から退き、3 つの関連技術が興隆した:

ウェーブテーブル合成は、複数の鍵に短いサンプル(多くは単一周期)を保存し、ピッチと変調が変わるにつれてそれらをクロスフェードした。数学的には、ウェーブテーブルの調波スペクトルビンパターンである——だがシンセサイザーはウェーブテーブルを不透明なブラックボックスとして扱った。ユーザーインターフェースは「ウェーブテーブル 47 を選択」と言い、「これらの周波数にこれらの振幅でビンを配置」とは言わなかった。起こっていたことのビン直接性は隠されていた。

ベクター合成(Korg Wavestation、Sequential Prophet VS)は、4 つのウェーブテーブルを 2 次元空間でブレンドした。スペクトル的には、これは 4 つのビンパターン間の補間である。再び、根底のビン直接構造は真であったが、ユーザーには不可視だった。

グラニュラー合成(Roads、Truax、その後 Native Instruments Reaktor)は音源を 1–100 ms の粒に切り分け、再構成した。各粒はスペクトルを持つ。集約音は粒スペクトルの時変重ね合わせである。これは事実上、ビン自体が複雑(各「ビン」は単一正弦波ではなく粒)であり、アドレス指定が決定論的ではなく統計的であるビン直接アドレスである。

これらの技術は音響デザイナーと作曲家にとって膨大に生産的だった。だがそれらは、統一されたビンパターンパラダイムの実例として提示も理解もされなかった。数学はきわめて異なるユーザーインターフェース・メタファーの背後に隠されていた:「波形を選択」「ジョイスティックでブレンド」「粒を散布」。各メタファーは独自の規律のように感じられた。

1990 年代はビンパターンが強力であることを経験的に確認したが、ビンパターンが起こっていたことであることを理論的には不明瞭にした。

2011年 — Native Instruments Razor:ビン・パラダイムが地表に戻る

2011年、Errorsmith と Native Instruments は Razor をリリースした——Reaktor 上に構築された加算合成器で、その明示的なユーザーインターフェースはビン直接だった。

Razor のインターフェースは最大 320 のパーシャルをリアルタイム・スペクトルビューとして表示した。ユーザーはビンの周波数、振幅、アニメーションを直接操作した。Razor の特徴的なプリセットの多くは紛れもなく非調波である——鐘のような、金属的な、グリッチ風のテクスチャ——そのビン格子は基音の単純な整数倍ではない。

Razor が広く画期と受け取られたのは、数学が新しかったからではない——それは数十年前から知られていた——FM 時代から続く「パッチ」「ウェーブテーブル」「グレイン」抽象の下に隠すのではなく、ユーザーインターフェースがついにビン直接アドレスを主要メタファーとしたからである。FM 合成と共に育った作曲家は、自分が FM 用語では明確化できないことをしている自分に気づいた——彼らはもはや FM のビンパターン空間の薄切りに制約されていなかったからである。

Razor はビン直接アドレスのインターフェース論を実証した。実証しなかった(できなかった)のは、スケールにおけるハードウェア論である。Razor は CPU 上で動作し、ボイスあたり 320 パーシャルが上限である。ソフトウェア加算合成としては顕著な数だが、たとえばピアノ弦やマリンバ・バーのスペクトル解析が完全再構築のために要求するレベルからは数桁低い。

Razor は、公正な UI を与えられればビン直接アドレスが勝つことを示した。残された問いは:公正なハードウェアを与えられたら何が起こるか、だった。

2010 年代以降 — 幾何合成の静かな復興

ポリゴナル合成(とそのベッセル係数一般化)。小規模な文献が、波が「回転するポリゴン」——頂点数と回転速度がスペクトルを決定する仮想的な回転形——によって生成された場合に何が起こるかを探究した。数学は FM に直接戻る仕方でベッセル関数を含むことが判明する。ポリゴナル合成は事実上、より一般的な変調器構造を持つ FM であり、それ自体がベッセル重みを持つ調波スタック側波帯を生み出す。

これらはビン直接パラダイムとして認識可能である。これらはおおむね学術的またはブティック的にとどまってきた——なぜなら、それらをフルスペクトル分解能で実時間レンダリングするのに必要なハードウェア——サブ Hz 周波数分解能を持つ数千の独立オシレータ——が日常的には利用可能でなかったから。

FPGA Spectrum Engine の系譜上の位置

本プロジェクトに記述される FPGA Spectrum Engine は、意図的設計により、上記すべてのパラダイムを同時にスケールで実現できる最初の汎用ハードウェアである。

10,240 オシレータ、各々 0.001 Hz 周波数分解能、各々独立にプログラム可能な振幅と位相、48 kHz で 1 サンプル遅延でコヒーレントに総和される。アーキテクチャは最も妥協のない意味でビン直接である:ビンが何をすべきかについての組み込み前提は存在しない。ユーザー——あるいは、より頻繁には上流の抽象層——が選ぶ。

これが具体的に意味するもの:

エンジン上の FM 合成はビンパターン 周波数 = [ωc ± n·ωm], 振幅 = [Jₙ(β)]。DX7 パッチを再生するには、その側波帯スペクトルを計算してビンに書き込む。完了。

加算合成はビンパターン 周波数 = [k·f₀], 振幅 = [aₖ]。加算パッチを再生するには、整数倍周波数を任意の振幅で書き込む。完了。

ポリゴナル/ベッセル合成は、周波数 [(kN+1)·ω₀ - n·ωₘ]cₖ(N)·Jₙ(kNβ) で重み付けされた振幅——ベッセル係数一般化——のビンパターン。完了。

ウェーブテーブルは、ウェーブテーブルの単一周期を FFT して得られる調波スペクトルを書き込んだビンパターン。完了。

スペクトラル・フラクタルは、Cantor 集合位置あるいは 1/fᵅ 間隔周波数のビンパターン。完了。

Shepard トーン、スペクトル形式の物理モデル、グラニュラーの平均スペクトル、音響楽器の生計測スペクトル——すべて対応するビンパターンを書き込むことで完了する。

このエンジンは正確な意味で普遍的である:ビンパターンとして表現できず本ハードウェア上にレンダリングできない既知の合成技術は、私の知る限り、存在しない。以前にどの技術がどのハードウェアに収まるかを決めていた制約——分野に世紀規模の「パラダイム」連続を与えていた制約——は解消される。

ハードウェア制約が取り除かれると何が変わるか

上記の歴史は簡潔に再話できる:合成のあらゆる「パラダイム」は、利用可能なハードウェアの部分集合に普遍ビンパターン問題を投影する巧妙な方法だった。FM はそれを 1 つのオシレータと周波数変調に投影した。加算はそれを調波格子とエンベロープジェネレータに投影した。ウェーブテーブルはそれを保存された単一周期に投影した。各投影は名前、語彙、正典的パッチ集合、文化を持っていた。

投影がもはや必要ないとき、問いが変わる。もはや「どのパラダイムを使うか」ではない。問いは「どのビンパターンが欲しいか」になる。 その問いへの答えはもはやシリコンに収まるものに制約されない;制約するのは、人間の作曲家か上流のアルゴリズムが明確化できることのみである。

これが FPGA Spectrum Engine が利用可能にすべく設計されたシフトである。エンジン自体は普遍的である。興味深い仕事は上流に移る——ビンパターンを決める抽象層へ。PC 層の言語、ARM HPS のシーン展開器、ビンパターン生成器——これらが新しい作曲語彙が発明される場所である。

Build Log #4 との連結 — なぜこれが Open Prompt にとって重要か

このエンジンが投影制約を取り除く最初のハードウェアであるなら、その設計知識に何が起こるかは重要になる。過去の合成パラダイム——FM、ウェーブテーブル、ベクター——はそれぞれ特定の商業企業内で開発された。それらの社内ノウハウはおおむね失われたか専有的だった。Yamaha は DX7 のアルゴリズム木がゲートレベルでどう実装されたかを公表しなかった——そして誰もそれを尋ねる必要がなかった。問いが興味深くなる頃には、FM の文化的瞬間はすでに過ぎていたから。

FPGA Spectrum Engine は別様に公開されている。アーキテクチャ、その背後の推論、サンプル実装は、Build Log #4 で記述された Open Prompt の三層スキームによりパブリックコモンズに置かれている。これが意味するのは:有能な言語モデル協働者を持つ任意のエンジニアが、任意の合理的な FPGA プラットフォーム上で、任意の時点で、このエンジンを再生成でき、そして設計空間は私の特定の実装選択によって閉じられるのではなく、彼らの革新のために開かれたままである、ということ。

これが重要である理由は、エンジンの価値は現在の実装にあるのではなく、その上に成長するビンパターン的作曲語彙にあるからだ。それらの語彙は、根底のエンジンが広くアクセス可能で広く理解されている場合に最も繁茂する可能性が高い。Open Prompt はその広いアクセス可能性を、単に意図されたものではなく構造的に必然なものにする配布機構である。

換言すれば:技術的系譜と配布パラダイムは同じプロジェクトを異なる角度から見たものである。エンジンはビンパターン問題に公正なハードウェアが与えられた時に可能になるもの。Open Prompt は工学プロジェクトに LLM 時代の公正な配布が与えられた時に可能になるもの。両者とも、歴史が自然なものとして扱ってきた制約の除去である。

私が楽しみにしていること

この議論が正しければ、合成の次の十年は新しい「パラダイム」によってよりも——ビン直接の普遍性に達した後には新しいパラダイムは存在しない——普遍エンジンの上に構築される新しい作曲語彙によって、より少なく定義される。ビンパターン代数で直接作曲することはどう聞こえるか? ビン分布上の進化的アルゴリズムでは? 人間が言葉を持たなかった知覚的特性に最適化された機械学習発見ビンパターンでは?

私には分からない。驚くことを期待している。エンジンを Open Prompt として公開する目的は、見つけ出す者が私だけにならないようにするためである。

次回予告

本ログは初期の 4 Build Log シリーズを閉じる。今後の Build Log は具体的な発展を追う:

Companion interactive page: https://dsohnaka.github.io/FPGA_Spectrum_Engine/ Open Prompt repository: https://github.com/dsohnaka/FPGA_Spectrum_Engine_OpenPrompt

Discussions