Tag: optimization

Tag: optimization

Beyond Positional Bias: How DroPE Unlocks Zero-Shot Long Context in LLMs (23 Feb 2026)
Paper Review: Smarter, Better, Faster, Longer: A Modern Bidirectional Encoder for Fast, Memory Efficient, and Long Context Finetuning and Inference (23 Dec 2024)
Paper Review: Byte Latent Transformer: Patches Scale Better Than Tokens (16 Dec 2024)
Paper Review: QA-LoRA: Quantization-Aware Low-Rank Adaptation of Large Language Models (05 Oct 2023)
Paper Review: QLoRA: Efficient Finetuning of Quantized LLMs (01 Jun 2023)
Paper Review: Linformer: Self-Attention with Linear Complexity (10 Jun 2020)

All tags

paperreview (193) deeplearning (189) cv (76) nlp (75) llm (67) transformer (36) multimodal (22) blogpost (19) pretraining (17) sota (15) imagesegmentation (14) attention (12) finetuning (11) pytorch (10) objectdetection (10) career (9) rl (8) imagegeneration (8) diffusion (8) video (7) stablediffusion (7) agent (7) vlm (6) optimization (6) life (6) datascience (6) timeseries (5) speech (5) selfsupervised (5) mllm (5) visual (4) ner (4) languages (4) gan (4) audio (4) yolo (3) tts (3) tokenization (3) superresolution (3) styletransfer (3) rnn (3) recommender (3) reasoning (3) kaggle (3) imagecaptioning (3) gnn (3) fewshotlearning (3) distillation (3) bert (3) augmentation (3) videogeneration (2) transferlearning (2) simulation (2) scaling (2) relationextraction (2) ranking (2) rag (2) qa (2) mamba (2) machinelearning (2) jobsearch (2) graph (2) gpt (2) generation (2) efficiency (2) dpo (2) competition (2) cnn (2) classification (2) weaksupervision (1) unet (1) textgeneration (1) tensorflow (1) tabular (1) swa (1) summarization (1) speechtranslation (1) speechtospeech (1) speechrecognition (1) sentenceembeddings (1) semisupervised (1) robustness (1) robotics (1) recurrent (1) realtime (1) quantization (1) promptengineering (1) objecttracking (1) nlg (1) nas (1) motivation (1) motiontracking (1) mlp (1) mentoring (1) memoryoptimization (1) languagetranslation (1) jigsaw (1) interview (1) instructlearning (1) inferencespeed (1) imagetextmatching (1) imagerestoration (1) imageinpainting (1) forecasting (1) flowmatching (1) fail (1) evaluation (1) entitylinking (1) endtoend (1) embedding (1) depthestimation (1) curriculumlearning (1) contrastivelearning (1) coco (1) clip (1) chatbot (1) captioning (1) books (1) autoencoder (1) asr (1) architecture (1) annotation (1) anchorfree (1) alignment (1) advice (1) adversarial (1) activationfunction (1)