Ein einfaches und effizientes Token-Zählprogramm, geschrieben in Rust! 🚀
English | 简体中文 | 繁體中文 | 日本語 | 한국어 | Deutsch
Diese Rust-Implementierung des klassischen wc
(Wortzählung) Kommandozeilenwerkzeugs ermöglicht es Ihnen, Zeilen, Wörter, Zeichen und sogar Tokens in Textdateien oder aus der Standardeingabe zu zählen. Es ist schnell, zuverlässig und unterstützt Unicode! 🌍✨
- Zählt Zeilen 📏
- Zählt Wörter 🔤
- Zählt Zeichen (einschließlich mehrbytiger Unicode-Zeichen) 🔡
- Zählt Tokens mit verschiedenen Tokenizer-Modellen 🔢
- Verarbeitet mehrere Dateien 📚
- Liest aus der Standardeingabe 🖥️
- Unterstützt verschiedene Sprachen (Englisch, Koreanisch, Japanisch und mehr!) 🌐
Es gibt zwei Möglichkeiten, tc zu installieren:
-
Stellen Sie sicher, dass Rust auf Ihrem System installiert ist. Falls nicht, laden Sie es von rust-lang.org herunter 🦀
-
Klonen Sie dieses Repository:
git clone https://github.com/guuzaa/tc.git cd tc
-
Bauen Sie das Projekt:
cargo build --release
-
Die ausführbare Datei finden Sie unter
target/release/tc
-
Gehen Sie zur Releases-Seite des tc-Repositories.
-
Laden Sie die neueste Version für Ihr Betriebssystem und Ihre Architektur herunter.
-
Entpacken Sie das heruntergeladene Archiv.
-
Verschieben Sie die
tc
-Ausführungsdatei in ein Verzeichnis in Ihrem System-PATH (z.B./usr/local/bin
auf Unix-ähnlichen Systemen). -
Sie können tc jetzt von überall in Ihrem Terminal verwenden!
-l, --lines
: Zeigt die Zeilenanzahl 📏-w, --words
: Zeigt die Wortanzahl 🔤-c, --chars
: Zeigt die Zeichenanzahl 🔡-t, --tokens
: Zeigt die Token-Anzahl 🔢--model <MODEL>
: Wählt das Tokenizer-Modell (Standard: gpt3)
Verfügbare Modelle:
gpt3
: r50k_baseedit
: p50k_editcode
: p50k_basechatgpt
: cl100k_basegpt4o
: o200k_base
Wenn keine Optionen angegeben werden, werden alle Zählungen (Zeilen, Wörter, Zeichen und Tokens) angezeigt.
-
Zähle Zeilen, Wörter und Zeichen in einer Datei:
tc beispiel.txt
-
Zähle nur Wörter in mehreren Dateien:
tc -w datei1.txt datei2.txt datei3.txt
-
Zähle Zeilen und Zeichen aus der Standardeingabe:
echo "Hallo, Welt!" | tc -lc
-
Zähle Tokens mit dem ChatGPT-Tokenizer:
tc -t --model chatgpt beispiel.txt
-
Zähle alles in Dateien mit verschiedenen Sprachen:
tc englisch.txt koreanisch.txt japanisch.txt
Beiträge sind willkommen! Zögern Sie nicht, Probleme zu melden oder Pull-Requests einzureichen. 🎉
Dieses Projekt ist unter der MIT-Lizenz lizenziert. Weitere Details finden Sie in der LICENSE Datei. 📄
- Der Rust-Community für ihre erstaunlichen Werkzeuge und Unterstützung 🦀❤️
- Dem ursprünglichen Unix
wc
-Befehl für die Inspiration 🖥️ - Dem Cursor-Editor 🤖
Viel Spaß beim Zählen! 🎉📊🚀