LLM Inference Engineering: Quantization, KV-Cache Optimization, and High-Throughput Serving: A Production Engineer's Guide to INT4/INT8 ... Speculative Decoding, Cost Optimization
Pagina's: 82, Paperback, Independently published
Prijzen voor het laatst bijgewerkt op: