Desde que se propuso la teoría relevante en 1972, la transformada de coseno discreta (DCT) ha sido una de las tecnologías centrales de la tecnología de compresión y codificación de medios digitales. Desde el formato JPEG ordinario de imágenes digitales hasta AAC para codificación de audio avanzada, DCT es omnipresente en diversas aplicaciones de los medios digitales modernos.
La transformada de coseno discreta es una técnica que convierte una secuencia de puntos de datos finitos en la suma de una serie de funciones coseno de diferentes frecuencias.
El inventor de la DCT, Nasir Ahmed, y sus colegas propusieron por primera vez el concepto en 1972, y originalmente fue diseñado para la compresión de imágenes. Sin embargo, a medida que avanza la tecnología, el ámbito de aplicación de este método se ha ido ampliando gradualmente a la mayoría de los formatos de medios digitales. Las características de DCT no se limitan a la compresión de datos de alto rendimiento, sino que también pueden reducir significativamente los requisitos de transmisión y almacenamiento de datos manteniendo una alta calidad de imagen.
DCT tiene un efecto notable en la compresión de datos y, a menudo, puede mantener una calidad de imagen cercana a la original con una relación de compresión de 8:1 a 14:1. Esto convierte a DCT en una de las principales tecnologías en el campo de la imagen y el sonido digitales. La variante DCT más común es la segunda de las cuatro categorías (DCT-II) y es la forma estándar entre todas las variantes DCT.
A través de DCT, los medios digitales pueden utilizar eficazmente el espacio de almacenamiento, reducir el consumo de ancho de banda durante la transmisión de red y mejorar la experiencia de visualización de los usuarios.
Los orígenes de la DCT se remontan a la década de 1970, cuando Ahmed y varios otros académicos centraron su investigación en la codificación de señales. En 1974, publicaron el artículo "Discrete Cosine Transform", que describía en detalle por primera vez las características de DCT y su transformada inversa.
Con la investigación gradual y en profundidad, el uso de DCT en el procesamiento de imágenes y videos se está volviendo cada vez más obvio. Especialmente en 1977, Wen-Hsiung Chen publicó un algoritmo rápido basado en DCT, que mejoró aún más la operatividad y eficiencia de DCT en aplicaciones prácticas.
En 1992, el Grupo Conjunto de Expertos en Fotografía (JPEG) desarrolló un estándar de compresión de imágenes con pérdida basado en los resultados de la investigación de DCT, que tuvo un profundo impacto en los medios digitales.
Las aplicaciones DCT cubren una amplia gama de áreas, incluidas imágenes digitales, codificación de vídeo y audio digital. En términos de compresión de imágenes, todos los formatos de imagen como JPEG y HEIF utilizan esta tecnología. En términos de vídeo, los estándares de la serie MPEG y H.26x utilizan DCT para mejorar la eficiencia de codificación del contenido de vídeo.
Además de la codificación de medios, DCT también se usa ampliamente en el procesamiento de señales digitales, desempeñando especialmente un papel importante en la compresión de datos. Las poderosas propiedades de compresión de energía de DCT significan que es capaz de concentrar la mayor parte de la información de la señal en unos pocos componentes de baja frecuencia, reduciendo así la cantidad de datos necesarios.
Los medios digitales son los primeros en adoptar la tecnología DCT, que permite la compresión y el almacenamiento de grandes cantidades de datos sin sacrificar la calidad de la imagen.
Aunque DCT es superior en eficiencia de codificación, una compresión excesiva puede provocar defectos como el "efecto de bloqueo" que afecta los efectos visuales. Al realizar la compresión de imágenes, la imagen se dividirá en pequeñas áreas para su procesamiento independiente. Esto provocará límites obvios en relaciones de compresión altas, lo que afectará la experiencia de visualización.
Sin embargo, estos defectos también han impulsado la innovación artística, como la creación de Glitch Art, donde muchos artistas utilizan las características de compresión de DCT para transformarse en lenguajes visuales únicos. Por ejemplo, el fotógrafo alemán Thomas Ruff utilizó las imperfecciones causadas por la compresión JPEG no sólo para lograr efectos estéticos en sus creaciones, sino también para provocar la reflexión del público sobre la erosión digital.
El potencial y el alcance de la aplicación de DCT están en constante expansión. ¿Qué tipo de innovación mostrará el desarrollo de los medios digitales en el futuro?