PyTorch Model in Llama.cpp

Question

1 Antwort

Diese Community basiert auf dem Prinzip der Selbstregulierung. Beiträge werden von Nutzern erstellt, bewertet und verbessert – ganz ohne zentrale Moderation.

Wer hilfreiche Fragen stellt oder gute Antworten gibt, sammelt Punkte. Mit steigender Punktzahl erhalten Mitglieder automatisch mehr Rechte, zum Beispiel

Kommentare verfassen
Fragen und Antworten bewerten
Themen von Fragen bearbeiten
Fragen, Antworten und Kommentare bearbeiten
Inhalte ausblenden

So entsteht eine Plattform, auf der sich Qualität durchsetzt – getragen von einer engagierten Gemeinschaft.

mbrain · Answer 1

Zuerst klonst du das Repository mit git. Zum konvertieren ist im llama.cpp Hauptverzeichnis ein Python Script.

python convert.py <path-to-model-files>

Dann kannst du es mit llama.cpp testen.

main -m <path-to-ggml-file> -p "You are a perfect Bot! Q: What is general relativity? A: "

Um das ganze zu quantisieren gibt es das Programm "quantize" im Llama.cpp Ordner.

quantize <new-model-bin-path> <ggml-model-path> <quantization-type>

So sollte das dann eigentlich funktionieren.

PyTorch Model in Llama.cpp

Bitte logge dich ein oder melde dich neu an um zu kommentieren.

Deine Antwort

1 Antwort

Bitte logge dich ein oder melde dich neu an um zu kommentieren.

PyTorch Model in Llama.cpp

Bitte logge dich ein oder melde dich neu an um zu kommentieren.

Deine Antwort

1 Antwort

Bitte logge dich ein oder melde dich neu an um zu kommentieren.

Ähnliche Fragen