MetaがLlamaの量子化モデルを公開。モバイルデバイス向けに処理速度2-4倍、メモリ使用量41%削減を実現

AIニュース Metaは2024年10月24日(現地時間)、モバイルデバイス向けに最適化された量子化されたLlamaモデル(Llama 3.2 1Bおよび3B)の提供を開始した。 この新モデルは、Quantization … 続きを読む MetaがLlamaの量子化モデルを公開。モバイルデバイス向けに処理速度2-4倍、メモリ使用量41%削減を実現