Categories News

Token Economics-Telegraph Prompt Word-Dark Execution Thread

A partire dal 1/6, Github Copilot verrà fatturato interamente in Token. Vari modelli come GPT/Claude/Gemini hanno ridotto le quote di token o aumentato le tariffe. L’era dello sperpero di gettoni è finita…

L’unità utilizzata dal modello linguistico LLM large per elaborare dati e generare contenuti è Token (lettura estesa: Esperimenti e osservazioni sulla conversione del testo in ChatGPT Token, Go Gadget – CLI Version Token Counter). Oltre a essere correlato alla fatturazione dell’utilizzo del modello, è anche correlato alla qualità dei risultati generati dall’intelligenza artificiale. Il modello LLM ha una cosiddetta finestra di contesto e diversi modelli hanno limiti superiori diversi:

Serie di modelli Finestra di contesto massima (Token) Produzione massima (gettoni)
GPT-5.4/5.4-pro 1M 128K
GPT-5.4-mini/nano 400K (limite di ingresso 272K) 128K
GPT-4.1 1KK 128K
Claude Sonetto 4.6 / Opus 4.6 1KK 128K
o3/o4-mini 200.000 128K
GPT-4o 128K 4.096
DeepSeek-R1 128K 32.768
maestrale grande 2 128K 128K

Sebbene la lunghezza della finestra di contesto di ogni modello di nuova generazione continui a superare e possa raggiungere il livello 1M, troppo lunga può facilmente portare alla diluizione dell’attenzione e a problemi di allucinazioni e può portare a fenomeni di “marcio del contesto” come parole ripetute, incoerenza semantica o confusione logica nel modello. Tutto sommato, per ottenere lo stesso risultato, utilizzare meno token non solo farà risparmiare sui costi, ma produrrà anche una migliore qualità.

Tornando ad AI Coding, questo principio si applica anche quando inseriamo parole rapide nella finestra di chat di Github Copilot / Claude / Codex. Come esprimere le nostre intenzioni in modo accurato ed efficace con meno token e ottenere i risultati attesi è un argomento nuovo nella nuova era dell’economia dei token. (Cosa? Hai dieci abbonamenti MAX e non ti sei mai preoccupato della quota Token? Ehi, con il tuo potere di modello, non hai bisogno di studiarli con noi. Puoi semplicemente ampliare l’intero processo)

In breve, ho passato un po’ di tempo a controllare le informazioni e a cercare suggerimenti su come far sì che l’intelligenza artificiale suggerisca la parola “una parola d’oro”.

Innanzitutto, secondo la teoria della “tassa sulla lingua”, l’utilizzo del cinese su GPT, Claude, Gemini e altri modelli consumerà più token dell’inglese. Pertanto, a meno che non si utilizzino modelli cinesi come Qwen, DeepSeek, Kimi, ecc., scrivere parole immediate direttamente in inglese è una scelta migliore.

Successivamente, qualche tempo fa, ha ricevuto attenzione un’abilità Caveman che può essere installata su Codex, Gemini, Cursor, Windsurf e Copilot (il progetto Github ha 64.000 stelle), sostenendo di risparmiare il 75% dei token. Il metodo è semplicissimo. In SKILL.md, all’Agente viene chiesto di parlare come una persona primitiva, rimuovendo articoli, riempitivi e parole educate… Tuttavia, i termini parole chiave, blocchi di codice di programma, ecc. vengono completamente mantenuti per rendere l’output del modello breve e non verbale.

Quando lo stesso concetto viene applicato alle parole immediate, esiste un concetto correlato: utilizzare il metodo di telegrafare le parole immediate. Nei tempi antichi, prima dell’avvento dei telefoni, la messaggistica istantanea a lunga distanza poteva basarsi solo sul codice Morse per trasmettere il testo telegrafico e le tariffe erano basate sul numero di parole e sulla distanza. Pertanto, la persona che inviava il messaggio doveva scervellarsi per esprimere il significato con il numero minimo di parole, il che è simile alla situazione attuale in cui si abbassa il numero di token per ridurre i costi e migliorare la qualità.

La tecnica del prompt telegrafico (suggerimento telegrafico, a volte chiamato anche compressione del prompt o ottimizzazione del token) si riferisce alla rimozione dei verbi ausiliari, degli articoli, dei segni di punteggiatura o delle parole educate ridondanti nelle parole rapide, mantenendo solo il significato principale delle parole chiave, in modo conciso come nel telegrafare. Piace:Refactor: improve readability, O(n) complexity, TypeScript. Questo è abbastanza. Lo stile telegrafico non ha bisogno di preoccuparsi del soggetto, dell’avverbio, della preposizione e non ha bisogno di perdere tempo per formare frasi grammaticalmente corrette ed eleganti. Oltre a ridurre la quantità di gettoni, può anche salvare il cervello. Tuttavia, sento che dopo aver scritto per molto tempo, la capacità di scrivere e parlare inglese peggiorerà😄

Di seguito sono riportate alcune tecniche frammentarie che ho trovato per scrivere prompt in stile telegramma: (Le mie applicazioni quotidiane sono per lo più basate sulla codifica AI, quindi le tecniche saranno più procedurali, ma alcune sono applicabili anche in situazioni non programmatiche)

Non dire per favore, grazie o scusa. È superfluo essere educati quando si spiegano i compiti dell’IA.

Il primo dei 26 principi suggeriti dalla ricerca è “Non è necessario essere educati nei confronti del LLM (come dire per favore, grazie), basta parlare direttamente dei punti chiave”. Gli esperimenti hanno dimostrato che troppe parole sociali non solo sprecano token, ma talvolta interferiscono con l’attenzione dell’IA sulle istruzioni fondamentali.
Could you please write a Python function to sort a list?
Write Python list sort function.

Definire i ruoli invece di lunghe descrizioni di definizione

Specificare direttamente il ruolo dell’IA da svolgere (ad esempio:Act as a senior Go Dev.)E I want you to act as a senior software engineer specialized in Google's Go programming language L’effetto è simile, ma è possibile salvare l’80% dei gettoni.

Limita l’output non valido

L’intelligenza artificiale è molto loquace e spesso aggiunge spiegazioni e condivisione di pensieri oltre alle risposte. Se vogliamo solo i risultati, questi contenuti aggiuntivi sono ridondanti e sprecano preziosi token di output (i token di output sono solitamente molte volte più costosi dell’input). Esistono alcune abbreviazioni comuni che possono effettivamente impedire ai modelli di intelligenza artificiale di aggiungere la ciliegina sulla torta:

  • Code only./Pure code. Datemi il programma e del resto non discutiamo.
  • No prose. Prosa significa prosa, che si riferisce alla scrittura di una composizione incentrata su punti chiave.
  • No preamble. preambolo si riferisce alla prefazione o alle osservazioni di apertura
  • No postamble. Rimuovi il riepilogo e il promemoria dietro il codice del programma
  • No yapping. Non dire sciocchezze. Super feroce! Mi piace
  • No comments. Nessuna annotazione richiesta
  • Self-documenting code only. Il codice del programma stesso deve essere chiaro e facile da leggere, riducendo la dipendenza dalle annotazioni.
  • Docstring only. Genera solo commenti sui file di funzioni standard (come Javadoc, TSDoc, PyDoc), non spiega la logica
  • Bullet points. Usa il formato colonnare quando spieghi, non scrivere paragrafi lunghi

Istruzioni concise e concise sui vincoli

Se vuoi che il contenuto o il codice generato sia conciso e ortodosso, ci sono alcuni vincoli utili:

  • Concise. Punta alla semplicità
  • Idiomatic. Utilizza stili di scrittura coerenti con le migliori pratiche, filosofie e modelli di progettazione
  • Explain briefly. breve spiegazione
  • “Asciutto.” (Non ripeterti) evita di duplicare la logica ed estrai funzioni comuni
  • Solid. Segui i principi SOLID per scrivere programmi orientati agli oggetti facili da mantenere ed espandere.
  • Clean. È necessario rispettare il principio del “Codice pulito” e prestare attenzione alla denominazione variabile e alla chiarezza logica.
  • Production-ready. Richiede la considerazione dei dettagli richiesti per un ambiente di produzione (come gestione degli errori, registrazione, stabilità)
  • Modern. Utilizza le ultime funzionalità di sintassi del linguaggio (come Python 3.12+, Java 21+, ES6+)
  • Standard lib only. È vietato l’uso di librerie di equazioni di terze parti, vengono utilizzate solo le API integrate nel linguaggio
  • Performant. Dai priorità alle prestazioni e riduci il consumo non necessario di risorse
  • Memory-efficient. Dai priorità all’efficienza della memoria ed evita perdite di memoria o sovraallocazione
  • O(n). / O(1). Specificare un limite superiore alla complessità temporale Thread-safe.` 要求注意多執行緒環境的 Race Condition 問題
  • Scalable. Richiede che l’architettura tenga conto della scalabilità futura
  • Step-by-step. È necessario smontarlo passo dopo passo per facilitare la comprensione e l’apprendimento.
  • One-liner. Scrivi la logica come una singola riga (comune nelle istruzioni Bash o nella semplice logica Python)
  • ‵Riassunto di una frase` Riassunto di una frase
  • Raw. Restituisce il formato originale senza tag Markdown
  • Diff. Restituisce un differenziale come Git
  • Naive implementation. Hai solo bisogno del prototipo più semplice senza considerare l’ottimizzazione e non progettarlo eccessivamente.
  • Sanitized. Si riferisce specificamente all’elaborazione dell’input per prevenire SQL Injection, XSS e altri attacchi
  • Hardened. Rafforzare la protezione anti-attacco e di sicurezza
  • ‵Degrado gradevole.` Quando alcune funzioni falliscono, il sistema può ancora funzionare con funzioni limitate
  • Skeleton only. Genera solo definizioni di categorie e funzioni, solo lo scheletro e nessun dettaglio di implementazione.

Specificare il formato di output

Se hai bisogno di un formato specifico (come JSON, Diff), basta dirlo, ad esempio:Output: pure JSON., Format: git diff..

Fornisci semplicemente uno snippet di programma

Se vuoi spiegare al modello le parti da lavorare non è necessario incollare l’intero contenuto. Basta fornire definizioni di funzioni o categorie pertinenti, che possono essere utilizzate se necessario. //... Indica l’omissione di parti irrilevanti.

Fai buon uso di rappresentazioni strutturate come Markdown

utilizzo # ## Per distinguere i capitoli, utilizzare “`…“`, “””…””” per racchiudere il contenuto del blocco, utilizzare `code…`, 標示指令,能讓模型快速且有效率地理解你的意圖。

範例

以下是一些高效提示詞範例:

  • 重構程式碼:Refactor for performance: {code}
  • Scrivi un test:Write xunit tests. Focus on edge cases. Code only.
  • eseguire il debug:Debug: {error message}. Fix and explain briefly.
  • Cambia lingua:Convert this Python to Rust. Idiomatic.
  • Genera documentazione:Generate TSDoc for this function. Concise.
  • Revisione del codice:Code review. List 3 critical improvements.

In termini di applicazione, basti pensare a comunicare con l’IA utilizzando slang o gergo, come “Treno Nord Sud tre, ore sette”, “top tp 30, gioca sul sicuro”,“Tettone Weiwei”…potremmo fare un esempio del genere. Refactor this. Clean. Dry. Modern. Code only.,Explain this. Bullet points. 1-sentence summary. No yapping.

Un altro suggerimento è che questi suggerimenti sui punti di esecuzione possono essere posizionati alla fine della query del prompt, poiché il modello solitamente presta maggiore attenzione all’ultimo paragrafo (Recency Bias).

Verifica dei benefici

Per quanto riguarda le parole immediate del telegrafo, ho trovato ricerche pertinenti di alcuni anni fa, ma non ci sono prove autorevoli o condivisione di esperienze sull’ultimo modello:

Sebbene non esista un supporto ferreo, un semplice test dimostra che il passaggio ai telegrammi può effettivamente ottenere lo stesso effetto, il suo principio di funzionamento è ragionevole e ragionevole e l’intuizione sarà efficace. Dopo la ricerca, ho ritenuto che oltre al risparmio di token, il vantaggio maggiore di condensare e semplificare il testo di input è che può ridurre i costi di digitazione e accelerare l’input, e i vantaggi sono più evidenti. In breve, ho deciso di iniziare a provarlo quotidianamente nell’AI Coding e dopo un po’ condividerò la mia esperienza pratica.

[Postscript]Recentemente, sto lavorando a un progetto laterale del metodo di input vocale di Windows collegato al modello GPT. Il concetto è quello di modificare il servizio di traduzione vocale del precedente modello GPT in un metodo di input utilizzabile dal sistema operativo. “Integrare la filosofia del messaggio telegrafico e convertire i messaggi telegrafici dal cinese parlato in inglese” sembra un po’ entusiasmante, quindi ci proverò.

Esplora suggerimenti per la codifica IA efficiente in termini di token, che spiega l’aumento dei costi dei token, le restrizioni di contesto, le “tasse linguistiche”, lo stile cavernicolo e i suggerimenti sul telegrafo. Condivide tecniche pratiche per ridurre il markup di input/output mantenendo le istruzioni precise, strutturate ed efficaci.


PakarPBN

A Private Blog Network (PBN) is a collection of websites that are controlled by a single individual or organization and used primarily to build backlinks to a “money site” in order to influence its ranking in search engines such as Google. The core idea behind a PBN is based on the importance of backlinks in Google’s ranking algorithm. Since Google views backlinks as signals of authority and trust, some website owners attempt to artificially create these signals through a controlled network of sites.

In a typical PBN setup, the owner acquires expired or aged domains that already have existing authority, backlinks, and history. These domains are rebuilt with new content and hosted separately, often using different IP addresses, hosting providers, themes, and ownership details to make them appear unrelated. Within the content published on these sites, links are strategically placed that point to the main website the owner wants to rank higher. By doing this, the owner attempts to pass link equity (also known as “link juice”) from the PBN sites to the target website.

The purpose of a PBN is to give the impression that the target website is naturally earning links from multiple independent sources. If done effectively, this can temporarily improve keyword rankings, increase organic visibility, and drive more traffic from search results.

Jasa Backlink

Download Anime Batch

More From Author