Joseph Fourier bạn của Napoleon và ứng dụng câu hỏi làm nguội nòng pháo đã thay đổi thế giới hiện đại

Một chiếc TV màu yêu cầu phải có dữ liệu về ánh sáng đỏ, xanh lá và xanh dương. Thuật toán toán học này giúp đơn giản hóa việc truyền dữ liệu để chúng ta có được TV màn hình màu mà không cần tăng gấp ba lần nhu cầu trên các kênh cho mỗi màu.
Phép biến đổi Fourier là một công cụ quan trọng giúp các thiết bị điện tử của chúng ta hoạt động tốt hơn và đơn giản hơn. Nó thay đổi một biểu đồ thể hiện cách tín hiệu thay đổi theo thời gian thành một biểu đồ khác biểu thị cho tần số của tín hiệu.
Khi chúng ta chuyển đổi tín hiệu âm thanh hoặc hình ảnh thành tần số, nó giúp chúng ta kiểm tra và sửa đổi các tập tin âm thanh lẫn hình ảnh. Điều này được giải thích bởi Richard Stern, giáo sư kỹ thuật điện và máy tính tại Đại học Carnegie Mellon. Quy trình toán học này cũng cho phép chúng ta lưu trữ dữ liệu một cách hiệu quả hơn.
minh-hoa-ve-chuyen-doi-fourier.jpg

Nguyên tắc của Biến đổi Fourier là đưa dữ liệu trên miền thời gian về dữ liệu dựa trên miền tần số.

Ông Stern giải thích rằng việc tạo ra TV màu là một ví dụ minh họa hoàn hảo cho điều này. Trở lại những năm 1950, TV chỉ hiển thị hình ảnh với hai màu đen trắng đơn điệu. Khi các kỹ sư tại RCA (Radio Corporation of America) phát triển truyền hình màu, họ phải đối mặt với một thách thức: Họ cần thêm thông tin về ánh sáng đỏ, xanh lá và xanh dương vào tín hiệu phát sóng để tạo ra hình ảnh màu. Tuy nhiên, việc bổ sung thêm thông tin này có thể làm tăng gấp ba lượng dữ liệu cần thiết, gây ra sự quá tải cho các kênh phát sóng, vậy nên họ đã tận dụng các phép biến đổi Fourier để giúp việc truyền tải dữ liệu trở nên đơn giản hơn. Điều này cho phép ngành công nghiệp sản xuất tivi đưa màu sắc vào sản phẩm mà không cần làm kênh phát quá tải khi phải thêm dữ liệu về ánh sáng đỏ, xanh lá và xanh dương. Kết quả là những người dùng TV đen trắng vẫn xem được các hình ảnh cũ như từ đó tới giờ, trong khi những người dùng TV màu nay đã có thể thưởng thức những hình ảnh nhiều màu sắc, tất nhiên là bao gồm cả 2 màu đen-trắng sơ khai.
minh-hoa-cac-mau-co-ban-cua-tv.jpg

Chuỗi Fourier đã làm cho TV màu trở nên khả thi. Ảnh: Nationaltoday.

Góc nhìn đơn giản về phép Biến đổi Fourier

Ryan Hamerly, một nhà khoa học cấp cao tại công ty khởi nghiệp NTT Research ở Thung lũng Silicon, giải thích rằng phép biến đổi Fourier thay đổi thông tin dựa trên thời gian thành thông tin dựa trên tần số. Ví dụ: nếu chúng ta ghi âm một bản nhạc đánh đàn piano vào micrô, thì ta sẽ nhận được tín hiệu thay đổi theo thời gian. Nhưng mọi người cũng quan tâm đến phổ âm sắc, tức là những nốt nhạc nào được chơi thường xuyên nhất và phần nào của phổ âm là nghe lớn nhất. Thông tin này chính là tần số của nội dung.


ban-nhac-piano-duoc-chuyen-ve-dang-tan-so.png

Một phép chuyển đổi Fourier trong âm nhạc từ thông tin theo thời gian qua thông tin dựa theo tần suất. Ảnh: Wikipedia.

Stern giải thích rằng biến đổi Fourier là một quá trình trong đó tín hiệu được biểu diễn dưới dạng sin và cosin của nó ở các mức tần số khác nhau. Nói một cách đơn giản, sin là một khái niệm toán học được sử dụng cho tam giác vuông; đó là tỉ số giữa độ dài cạnh đối diện với một góc với độ dài cạnh dài nhất của tam giác, hay cạnh đối chia cho cạnh huyền. Tương tự, cosin là một khái niệm toán học khác cho cùng một tam giác, nhưng nó là tỉ số giữa độ dài cạnh kề với một góc với chiều dài cạnh dài nhất của tam giác.
tin-hieu-tro-thanh-cac-tan-so-co-ban.jpg

Biến đổi Fourier (FT) giúp cho tín hiệu theo thời gian được biểu diễn dưới dạng sin và cosin ở các mức tần số khác nhau. Ảnh: Intermathematics.
mot-vi-du-ve-cach-ien-doi-fourier-van-hanh.jpg

Một ví dụ đơn giản về cách Biến đổi Fourier đưa dữ liệu trên miền thời gian về dữ liệu dựa trên tần số, được biểu diễn bằng các hàm lượng giác.

Theo ông Stern, quá trình chuyển đổi này cho phép chúng ta sắp xếp tín hiệu theo tần số của chúng hoặc điều khiển các kênh phát sóng. Nó cung cấp cho chúng ta một sự hiểu biết sâu sắc hơn về cách mọi thứ hoạt động. Những khái niệm này có thể khó nắm bắt nếu chúng ta chỉ xem xét các tín hiệu thay đổi như thế nào theo thời gian. Tuy nhiên, chúng trở nên rõ ràng và dễ hiểu hơn nhiều khi chúng ta xem xét chúng theo các thành phần liên quan đến tần số.
nhung-chiec-tv-mau-dau-tien.jpg

Kể từ những chiếc TV màu đầu tiên, thế giới nghe nhìn của con người đã có những tiến bộ vượt bậc. Ảnh: Smithsonian Mag.
hoat-dong-kiem-tra-tv-mau-o-new-zealand-nam-1970.jpg

Trong TV màu, có ba thành phần tín hiệu chính, tương ứng với ba màu cơ bản: đỏ (R), xanh lá (G), và xanh dương (B). Các thành phần này được đưa vào 3 ống nhạy với 3 màu (gọi là ống VIDICON 1,2,3), để biến thành 3 thành phần điện áp ER, EG, EB (gọi tắt là R, G, B). Mỗi thành phần tín hiệu màu (R, G, B) được xem như một tín hiệu riêng biệt. Biến đổi Fourier được áp dụng cho từng tín hiệu này để phân tích thành các thành phần tần số. Vì nó chuyển đổi từng tín hiệu màu từ miền thời gian sang miền tần số nên chúng ta có thể phân tích tín hiệu màu sắc và độ sáng một cách riêng biệt. Các thành phần tần số của từng tín hiệu màu sau đó có thể được xử lý một cách độc lập, ví dụ như lọc nhiễu hoặc điều chỉnh độ sáng và độ tương phản. Sau khi đã xử lý các thành phần tần số, chúng ta có thể tái tạo lại tín hiệu màu sắc và độ sáng ban đầu.

Tầm quan trọng

Stern giải thích rằng các sản phẩm tiêu dùng kỹ thuật số, như là video, âm thanh, tín hiệu và hình ảnh đồ họa, liên tục sử dụng các phép biến đổi Fourier. Chúng lọc thông tin theo cách thức kỹ thuật số bằng một dòng mã được gọi là biến đổi Fourier rời rạc. Phương pháp kỹ thuật số này dễ dàng hơn nhiều so với phương pháp analog cũ vốn yêu cầu sử dụng các điện trở, bóng bán dẫn và cuộn cảm (công cụ để tạo ra từ trường).


Khi các tín hiệu được biểu thị dưới dạng tần số, chúng ta có thể giảm hoặc tăng các tần số khác nhau này. Quá trình toán học này cũng có thể được sử dụng để làm cho dữ liệu nhỏ hơn. Ví dụ: chúng ta có thể tạo ra các tập tin .mp3, cho phép lưu trữ hàng ngàn bài hát trên một chiếc smartphone nhỏ gọn. Điều này sẽ không thể thực hiện được với các tập tin định dạng .WAV vì chúng chiếm nhiều dung lượng hơn.

Ứng dụng trong kỹ thuật điện tử

Trong hoạt động truyền dữ liệu số, các thiết bị chuyển đổi một âm thanh rời rạc, một bản nhạc hoặc các loại thông tin khác nhau thành một chuỗi gồm các số 1 và 0, như Stern giải thích. Bước đầu tiên là các thiết bị lấy mẫu của tín hiệu. Để duy trì âm thanh chất lượng cao, tốc độ lấy mẫu ít nhất phải gấp đôi tần số cao nhất của tín hiệu đến. Vì tần số của giọng nói và âm nhạc đều ở dưới mức 20 kHz nên đĩa CD lấy mẫu âm thanh ở tốc độ 44.1 kHz. Âm thanh cũng có hai kênh - trái và phải - dành cho hai loa như chúng ta thường thấy trong các hệ thống âm thanh.


IMG-20231221-195044.jpg

Âm thanh của đĩa CD, một công cụ lưu trữ trước đây, thường ở tần số 44.1 kHz. Ảnh: Soundandvision.

Các lập trình viên đã cố gắng xoay sở để tiết kiệm nhiều dung lượng hơn bằng cách sử dụng một phương pháp gọi là mã hóa âm thanh cảm nhận. Phương pháp này giúp giảm lượng dữ liệu cần thiết xuống 10 hoặc 20 lần bằng cách ghi lại thông tin dựa trên cách con người nghe âm thanh. Điều này thật tuyệt vì nó có nghĩa là chúng có thể mua một cỗ máy phát nhạc có thể chứa nội dung nhiều hơn gấp 10 lần với cùng một mức giá, đây rõ ràng là một món hàng hời hơn.
Vì vậy, các phép biến đổi Fourier rất quan trọng đối với truyền thông điện tử ngày nay. Ông Stern giải thích rằng hầu hết mọi bước để truyền bản nhạc yêu thích từ đài phát thanh (hoặc bất kỳ nguồn nào khác) đến tai của chúng ta đều liên quan đến việc xử lý cả biểu đồ thời gian lẫn tần số. Nói một cách đơn giản, phép biến đổi Fourier là phương tiện giúp thực hiện được điều này.
cach-van-hanh-cua-bien-doi-fourier.jpeg

Phép biến đổi Fourier chuyển dữ liệu dựa theo thời gian/không gian về dữ liệu theo tần số, một phép chuyển đổi ngược (inverse) sẽ đưa dữ liệu về dạng dựa theo thời gian như cũ nhưng ở dạng đã cải thiện. Chẳng hạn như trong xử lý hình ảnh, máy tính tính toán các ma trận liên quan đến biến đổi Fourier để đưa hình ảnh đó từ dữ liệu dựa trên không gian (spatial) về dữ liệu dựa trên tần số, qua một số bước, nó thực hiện biến đổi Fourier ngược để cho ra một bức ảnh đã được làm đẹp (vd: tăng cường màu, bổ sung hiệu ứng, khử nhiễu, v.v…). Ảnh: 3Blue1Brown.

Ứng dụng trong Machine learning

Còn trong lĩnh vực machine learning (tạm dịch: máy học), máy tính sắp xếp các khuôn mẫu. Chúng lấy một mẩu thông tin trong thế giới thực, như âm thanh hoặc hình ảnh, đổi nó thành số và sau đó so sánh những con số này với dữ liệu chúng đã có. Ví dụ dễ thấy nhất là việc máy tính có thể nhận dạng khuôn mặt trong bức ảnh, khi điện thoại – một máy tính nhỏ - nhận dạng khuôn mặt lúc chụp hình và mở khóa. Điều này tương tự như cách con người học, chúng ta thu thập thông tin về một điều gì đó qua âm thanh, hình ảnh rồi đối chiếu với hiểu biết, nhãn quan của riêng mình để đưa ra các nhận xét, hay chính là cách chúng ta hiểu về đối tượng đó.


Các chuyên gia công nghệ chuyên về phát triển kỹ thuật machine learning đang cố gắng tìm ra những tính năng quan trọng nhất có thể, đồng thời phải đơn giản về mặt số học. Điều này làm cho việc tính toán dễ dàng hơn và giúp tiết kiệm không gian lưu trữ. Đối với âm thanh, thông tin này thường dựa trên các thành phần thuộc về tần số. Vì vậy, các phép biến đổi Fourier rất hữu ích cho kiểu phân loại này. Ví dụ: Phép biến đổi này có thể được sử dụng khi máy tính đang cố gắng nhận dạng giọng nói của một người.
IMG-20231221-195753.jpg

Ốc tai thực hiện phép ‘biến đổi Fourier' để đưa âm thanh tần số thấp đi đến phần đỉnh (apex) và tần số cao ở đáy (base). Ảnh: Alamy.

Chúng ta sắp xếp âm thanh theo cách tương tự như cách máy tính được dạy để phân tích chúng. Chúng ta thậm chí còn nghe được âm thanh dựa trên tần số của chúng. Stern giải thích rằng hệ thống thính giác trong tai của chúng ta thực hiện phép biến đổi Fourier trong ốc tai, một bộ phận của tai. Điều này được thực hiện theo cách cơ học, với những âm thanh tần số cao đi đến một đầu của màng ốc tai và tần số thấp đi đến đầu kia.
 

Có thể bạn quan tâm

Top