MetaがLlamaの量子化モデルを公開。モバイルデバイス向けに処理速度2-4倍、メモリ使用量41%削減を実現

AIニュース Metaは2024年10月24日（現地時間）、モバイルデバイス向けに最適化された量子化されたLlamaモデル（Llama 3.2 1Bおよび3B）の提供を開始した。この新モデルは、Quantization … 続きを読む MetaがLlamaの量子化モデルを公開。モバイルデバイス向けに処理速度2-4倍、メモリ使用量41%削減を実現