Cảnh báo lừa đảo‼️ Tao thất bại rồi sao....

noi_buon_khog_ten

Mai là mùng một
Japan
Đụ mẹ hôm nay tao đi báo cáo đồ án. Ban đầu tao nghĩ đơn giản lắm: lên trình bày, nói vài câu học thuật, chiếu vài cái biểu đồ, bị hỏi vài câu tượng trưng rồi xuống uống trà đá. Ai dè đâu, cuộc đời đéo bao giờ dễ như phim hoạt hình.

Tao bước vào phòng với tâm thế sinh viên IT hiền lành, trong đầu có ABR, Plume, SENSEI, Pensieve, simulator, model, dataset. Bước ra khỏi phòng thì trong đầu chỉ còn đúng một câu:

“Đụ mẹ, tao vừa sống sót qua Marineford phiên bản đồ án cơ sở.”

Hội đồng có 2 ông.

Một ông kiểu giáo viên khó tính, soi từ slide, nền tảng học thuật, nội dung ABR, công thức, nhãn, phương trình, dataset, nói chung là soi đéo sót cái gì. Mắt ổng nhìn slide như máy scan mã vạch ở Bách Hóa Xanh.

Ông còn lại thì tính cách như cái bẫy chuột. Không hỏi thì thôi, hỏi câu nào là câu đó có mùi “để tao xem mày chết ở đâu”. Giọng thì cứ cà khịa cà khịa, kiểu đéo cần giết mày ngay, để mày tự khai rồi tao chốt hạ.

Tao vừa mở bài được một đoạn, còn đang run run như điện thoại sắp hết pin, thì các ông bắt đầu vào combat.

Đề tài của tao là Content-Aware ABR.

Nói tiếng người là thế này:

ABR bình thường là cơ chế đổi chất lượng video theo mạng. Mạng mạnh thì video nét, mạng yếu thì giảm chất lượng để đỡ đứng hình. Cái này cơ bản rồi.

Nhưng tao làm thêm một ý:
Không phải đoạn video nào cũng quan trọng như nhau.

Ví dụ video bóng đá:

  • Cảnh cầu thủ đi bộ gãi đít giữa sân: giảm bitrate tí cũng được.
  • Cảnh sút penalty: đụ mẹ mà mờ đúng lúc đó thì người xem chửi cả nhà server.
Ví dụ video game:

  • Đứng trong lobby nhìn nhân vật xoay xoay: không quan trọng.
  • Đang combat, ulti tung tóe, máu bay như pháo hoa: phải giữ nét.
Ví dụ học online:

  • Thầy đang uống nước: mờ cũng đéo chết ai.
  • Thầy đang ghi công thức thi cuối kỳ: đứng hình phát là sinh viên bay màu.
Thế nên tao chia video thành nhiều chunk, mỗi chunk lấy đặc trưng như độ sáng, chuyển động, năng lượng hình ảnh, rồi tạo ra một điểm gọi là độ nhạy cảm nội dung, nằm từ 0 đến 1. Chunk nào quan trọng thì điểm cao, chunk nào bình thường thì điểm thấp. Sau đó tao dùng điểm này để mô phỏng việc chọn bitrate thông minh hơn.

Nghe đến đây thì ông thầy thứ nhất bắt đầu mở Sharingan.

Ổng hỏi:

“ABR là phải đi với mạng. Sao em lại đưa nội dung video vào? Như vậy là em làm thành cái khác rồi.”

Đụ mẹ, câu này đâm thẳng vào tim.

Tao mới giải thích:

“Dạ, ABR truyền thống đúng là dựa vào mạng, buffer, throughput. Nhưng hướng của em không bỏ yếu tố mạng. Em chỉ thêm content sensitivity vào reward/simulator để khi phải chọn bitrate, hệ thống biết ưu tiên đoạn quan trọng hơn.”

Nói nôm na là:

Không phải tao vứt cái xe máy đi rồi bảo đây là máy bay. Tao chỉ gắn thêm cái kính chiếu hậu để nhìn đường tốt hơn.

Nhưng ông thầy vẫn không buông.

Ổng kiểu:

“Không. ABR là mạng. Plume, SENSEI không kết hợp kiểu này được.”

Tao đứng đó nghe mà trong đầu vang lên nhạc nền One Piece đoạn Luffy bị đấm xuống đất.

Tao nghĩ bụng:

“Đụ mẹ, nếu cái gì cũng phải y chang bản gốc thì nghiên cứu làm con cặc gì? Lấy sách giáo khoa photo ra nộp cho nhanh.”

Nhưng ngoài mặt tao vẫn phải ngoan:

“Dạ em không nói em triển khai lại Plume hay SENSEI. Em dùng các bài đó làm nền tảng tham khảo. Ý tưởng là lấy cảm hứng từ sampling, sensitivity, content-aware decision rồi xây prototype riêng.”

Tức là tao đã nói rõ:

  • Không copy công thức tác giả.
  • Không nói nhãn của tao giống nhãn tác giả.
  • Không bảo đây là hệ thống production.
  • Không nhận vơ “em là cha đẻ Netflix thế hệ mới”.
Nhưng không.

Hai ông vẫn dí tiếp như chó nghiệp vụ thấy vali khả nghi ở sân bay.

Ông thứ hai bắt đầu hỏi:

“Dữ liệu em lấy ở đâu?”

Tao bảo:

“Dạ tác giả không public dataset gốc, nên em dùng KoNViD-1k. Đây là dataset video được dùng trong nghiên cứu đánh giá chất lượng video, có MOS, nguồn uy tín.”

Ổng hỏi tiếp:
“Thế em có train AI/model không?”
Tao nói:
“Có. Em chia video thành chunk, trích đặc trưng từng chunk, tạo proxy label từ các đặc trưng đó về thang 0 đến 1, rồi train model như Ridge, Random Forest, MLP để học mối quan hệ giữa đặc trưng chunk và độ nhạy cảm.”
Tao tưởng giải thích vậy là ổn rồi.
Ai dè ông đó phán:
“Em không thể lấy data trên mạng rồi tự làm abc xyz như vậy được.”
Đụ mẹ nghe câu đó tao đứng hình 2 giây.
Trong đầu tao lúc đó:
“Ơ thế dataset open sinh ra để làm gì? Để cúng à? Để tải về rồi ngắm thumbnail cho vui à?”
Tao lại phải giải thích:
“Dạ em không khẳng định đây là ground truth hoàn chỉnh. Em có ghi rõ trong báo cáo là proxy label, là bản thử nghiệm, dùng để chứng minh pipeline tồn tại trong simulator.”
Nghe tới chữ simulator, hai ông cười phá lên.
Đụ mẹ khoảnh khắc đó đúng kiểu tao vừa cast skill mà bị phản damage.
Một ông mặc áo khoác kiểu đô đốc Kizaru trong One Piece, ngồi cười như kiểu:
“Ồ, con mồi hôm nay biết nói tiếng người.”
Ông còn lại thì mặt kiểu:
“Thôi xong, tao đéo hiểu thằng này đang thuyết trình cái gì, nhưng tao vẫn phải ngồi đây tới hết giờ.”
Tao đứng trên đó, tay lạnh như vừa bóp cục đá trong Circle K, mồm thì cố nói, não thì mở 16 tab Chrome, tab nào cũng Not Responding.
Lúc đầu tao run thật.
Run kiểu:

  • Miệng nói “dạ thưa thầy”.
  • Trong lòng nói “đụ mẹ cứu tao”.
  • Tay bấm slide mà sợ bấm nhầm qua trang kết luận.
  • Mắt nhìn hội đồng mà cảm giác như nhìn boss cuối trong Dark Souls.
Nhưng sau khoảng 10 phút bị dí, tự nhiên tao hết run.
Không phải vì tao tự tin.
Mà vì tao cay
Cay quá nên não tự bật chế độ sinh tồn học thuật.
Tao bắt đầu lôi hết đồ nghề ra nói.
Tao nói:
“Dạ ABR truyền thống dùng throughput, buffer, bitrate history. Cái em làm không phủ nhận điều đó. Em chỉ thêm yếu tố content sensitivity. Khi mạng yếu, vẫn phải giảm bitrate. Nhưng nếu buộc phải giảm, thì nên giảm ở đoạn ít quan trọng trước, giữ chất lượng cho đoạn quan trọng hơn.”
Dịch ra tiếng người:
Nếu nhà nghèo phải ăn mì gói, thì ít nhất cũng nên để gói xúc xích cho thằng đang ôn thi, chứ không phải chia đều như ******** thời bao cấp.
Tao nói tiếp:
“Nhãn của tác giả và nhãn của em không giống nhau. Tác giả có pipeline và dữ liệu riêng. Em không có dataset gốc nên em tạo proxy label từ feature hình ảnh. Proxy label không phải cảm nhận người dùng thật, nhưng đủ để chứng minh ý tưởng trong phạm vi prototype.”
Nói trắng ra:
Tao đâu có bảo tao tạo ra chân lý vũ trụ. Tao chỉ bảo tao dựng được một mô hình thử nghiệm có đầu vào, có xử lý, có đầu ra, có số liệu, có giới hạn.
Mà hình như mấy ông nghe đến “giới hạn” là dị ứng.
Tao đã ghi rõ:

  • Không phải DASH player thật.
  • Không phải production system.
  • Không có MOS theo chunk chuẩn như lab lớn.
  • Không có hạ tầng kiểu Netflix.
  • Không phải DRL end-to-end như Pensieve.
  • Chỉ là prototype/simulator.
Nhưng hội đồng cứ muốn tao phải vừa là sinh viên, vừa là Netflix, vừa là phòng lab MIT, vừa là nhà mạng Viettel, vừa có server farm, vừa có người dùng thật ngồi đánh MOS.
Đụ mẹ đồ án cơ sở mà đòi như luận án tiến sĩ cộng thêm funding 2 triệu đô.
Xong tao chuyển qua phần lợi ích.
Tao nói hướng này nếu làm tốt thì có thể giúp:
  • Giữ chất lượng ở đoạn quan trọng.
  • Giảm lãng phí bitrate ở đoạn ít quan trọng.
  • Phù hợp với video bóng đá, game, học online, livestream.
  • Mở rộng ABR từ “chỉ nhìn mạng” sang “nhìn cả mạng lẫn nội dung”.
Tao đang nói mà trong đầu nghĩ:
“Đụ mẹ, tao đang bảo cái xe máy có thể gắn thêm GPS, mà mấy ông cứ bảo xe máy là phải có 2 bánh, GPS là làm nó thành tàu vũ trụ.”
Căng nhất là đoạn tranh luận về Plume và SENSEI.

Mấy ông cứ xoáy:
“Công thức của tác giả đâu?”
“Nhãn của tác giả đâu?”
“Em lấy dữ liệu tác giả ở đâu?”
“Em kết hợp thế nào?”
“ABR sao lại thành content-aware?”
“Em có train thật không?”
“Model học cái gì?”
“Label từ đâu?”
“Dataset có phù hợp không?”
Đụ mẹ hỏi không sót một câu. Hỏi kỹ tới mức tao tưởng lát nữa ổng hỏi luôn:
“Em sinh năm bao nhiêu? Lúc 3 tuổi đã có định hướng ABR chưa?”
Tao trả lời từng câu một.
Tao nói:
“Em không dùng nhãn của tác giả. Em tự tạo proxy label. Em không claim đây là kết quả của tác giả. Em dùng các bài báo làm hướng tham khảo. Phần đóng góp của em là pipeline thử nghiệm: video → chunk → feature extraction → sensitivity score → model training → content-aware reward → ABR simulation.”
Tức là cái luồng của tao rất rõ:

Video đầu vào
→ chia chunk
→ lấy đặc trưng từng chunk
→ tạo điểm nhạy cảm
→ train model dự đoán điểm đó
→ đưa vào simulator
→ so sánh cách chọn bitrate

Nó đéo phải ma thuật.
Nó cũng đéo phải bùa ngải.
Nó là pipeline thử nghiệm.
Nhưng cái khổ là khi người nghe đã chốt trong đầu rằng “ABR chỉ là mạng”, thì mày nói thêm nội dung vào là họ tưởng mày đang phạm tội phản quốc với ngành streaming.
Đến cuối buổi, tao cảm giác mình không còn đang bảo vệ đồ án nữa.
Tao đang bảo vệ quyền được tồn tại của cái ý tưởng:

“Video có nội dung, và nội dung có thể ảnh hưởng đến quyết định chọn bitrate.”

Nghe đơn giản vãi Lồn đúng không?
Vậy mà cãi 30 phút.
Có đoạn tao nhìn ông mặc áo Kizaru, tao nghĩ:
“Chắc lát nữa ổng đứng dậy bắn tia sáng bảo: ‘Em làm sai bản chất ABR rồi nhaaa~’”
Còn ông kia thì cứ kiểu nửa cười nửa khinh, làm tao cảm giác mình không phải sinh viên báo cáo, mà là thằng bán kem trộn bị quản lý thị trường bắt quả tang.
Nhưng công nhận một điều: bị dí như vậy mới biết trong đầu mình còn cái gì.

Lúc đầu tao run như chó đi tiêm.
Giữa buổi tao cay.
Cuối buổi tao nói như thằng bị nhập.

Cái gì biết tao lôi ra hết:
  • ABR truyền thống.
  • Throughput.
  • Buffer.
  • Bitrate.
  • Content sensitivity.
  • Proxy label.
  • Simulator.
  • Train model.
  • Ridge, Random Forest, MLP.
  • Dataset KoNViD-1k.
  • Giới hạn của đồ án.
  • Khác biệt giữa prototype và hệ thống thật.
Tao không dám chắc mấy ông hiểu hết. Nhưng ít nhất tao không chết đứng.

Sau buổi đó tao rút ra vài điều.

Thứ nhất, đi bảo vệ đồ án không phải chỉ cần slide đẹp. Slide đẹp mà gặp ông thích chém thì vẫn bị chém như thường.

Thứ hai, mày phải biết rõ mày đang claim cái gì. Mày mà nói quá lên là chết. Tao sống được một phần vì tao cứ bám vào câu:

“Đây là prototype/simulator, em không khẳng định là hệ thống production.”

Thứ ba, dataset open không có tội. Tội là mày không giải thích được tại sao dùng nó, dùng để làm gì, giới hạn ở đâu. May là tao còn nói được đoạn KoNViD-1k và proxy label, chứ không chắc bị xiên tại chỗ.

Thứ tư, ABR đúng là gắn với mạng. Nhưng nói ABR chỉ được nhìn mạng thì khác đéo gì nói điện thoại chỉ được dùng để gọi, ai cài Facebook là làm sai bản chất Nokia 1280.

Thứ năm, hai ông thầy cười phá lên thì cay thật. Nhưng nghĩ kỹ cũng hài. Một thằng sinh viên đứng giữa phòng cố giải thích content-aware ABR, hai ông thầy một ông như Kizaru, một ông như NPC khó chịu trong game, không khí thì căng như dây đàn. Cảnh đó mà quay lại up TikTok chắc viral mẹ nó luôn.

Chốt lại, buổi bảo vệ hôm nay như một trận boss fight.

Tao vào phòng với 50% máu, 20% tự tin, 100% lo sợ.
Boss phase 1: hỏi ABR.
Boss phase 2: hỏi Plume/SENSEI.
Boss phase 3: hỏi dataset.
Boss phase 4: hỏi train model.
Boss cuối: cười vào chữ simulator.

Tao không biết kết quả cuối cùng ra sao, nhưng tao biết một điều:

Tao không đứng im chịu chém.

Tao có run, nhưng vẫn cãi.
Tao có bí, nhưng vẫn quay lại được.
Tao có bị cà khịa, nhưng vẫn giữ được lõi đề tài.

Và cái lõi đó là:
ABR vẫn là bài toán chọn bitrate. Tao chỉ thử thêm yếu tố nội dung để việc chọn bitrate bớt ngu hơn.

Thế thôi.
Đụ mẹ, nghiên cứu mà đéo cho thử hướng mới thì thôi gọi là chép phạt học thuật cho rồi. Còn nếu thử hướng mới mà bị hỏi vặn thì cũng đúng, vì đó là hội đồng. Nhưng hỏi xong làm ơn nghe câu trả lời, chứ đừng chốt sẵn trong đầu rồi bắt sinh viên tự bơi trong nồi lẩu phán xét.
Hôm nay tao không biết mình thắng hay thua.
Nhưng tao biết chắc một điều:
Code chưa giết tao. Dataset chưa giết tao. Model chưa giết tao.
Tao thì khác...!
 
Đụ mẹ hôm nay tao đi báo cáo đồ án. Ban đầu tao nghĩ đơn giản lắm: lên trình bày, nói vài câu học thuật, chiếu vài cái biểu đồ, bị hỏi vài câu tượng trưng rồi xuống uống trà đá. Ai dè đâu, cuộc đời đéo bao giờ dễ như phim hoạt hình.

Tao bước vào phòng với tâm thế sinh viên IT hiền lành, trong đầu có ABR, Plume, SENSEI, Pensieve, simulator, model, dataset. Bước ra khỏi phòng thì trong đầu chỉ còn đúng một câu:

“Đụ mẹ, tao vừa sống sót qua Marineford phiên bản đồ án cơ sở.”

Hội đồng có 2 ông.

Một ông kiểu giáo viên khó tính, soi từ slide, nền tảng học thuật, nội dung ABR, công thức, nhãn, phương trình, dataset, nói chung là soi đéo sót cái gì. Mắt ổng nhìn slide như máy scan mã vạch ở Bách Hóa Xanh.

Ông còn lại thì tính cách như cái bẫy chuột. Không hỏi thì thôi, hỏi câu nào là câu đó có mùi “để tao xem mày chết ở đâu”. Giọng thì cứ cà khịa cà khịa, kiểu đéo cần giết mày ngay, để mày tự khai rồi tao chốt hạ.

Tao vừa mở bài được một đoạn, còn đang run run như điện thoại sắp hết pin, thì các ông bắt đầu vào combat.

Đề tài của tao là Content-Aware ABR.

Nói tiếng người là thế này:

ABR bình thường là cơ chế đổi chất lượng video theo mạng. Mạng mạnh thì video nét, mạng yếu thì giảm chất lượng để đỡ đứng hình. Cái này cơ bản rồi.

Nhưng tao làm thêm một ý:
Không phải đoạn video nào cũng quan trọng như nhau.

Ví dụ video bóng đá:

  • Cảnh cầu thủ đi bộ gãi đít giữa sân: giảm bitrate tí cũng được.
  • Cảnh sút penalty: đụ mẹ mà mờ đúng lúc đó thì người xem chửi cả nhà server.
Ví dụ video game:

  • Đứng trong lobby nhìn nhân vật xoay xoay: không quan trọng.
  • Đang combat, ulti tung tóe, máu bay như pháo hoa: phải giữ nét.
Ví dụ học online:

  • Thầy đang uống nước: mờ cũng đéo chết ai.
  • Thầy đang ghi công thức thi cuối kỳ: đứng hình phát là sinh viên bay màu.
Thế nên tao chia video thành nhiều chunk, mỗi chunk lấy đặc trưng như độ sáng, chuyển động, năng lượng hình ảnh, rồi tạo ra một điểm gọi là độ nhạy cảm nội dung, nằm từ 0 đến 1. Chunk nào quan trọng thì điểm cao, chunk nào bình thường thì điểm thấp. Sau đó tao dùng điểm này để mô phỏng việc chọn bitrate thông minh hơn.

Nghe đến đây thì ông thầy thứ nhất bắt đầu mở Sharingan.

Ổng hỏi:

“ABR là phải đi với mạng. Sao em lại đưa nội dung video vào? Như vậy là em làm thành cái khác rồi.”

Đụ mẹ, câu này đâm thẳng vào tim.

Tao mới giải thích:

“Dạ, ABR truyền thống đúng là dựa vào mạng, buffer, throughput. Nhưng hướng của em không bỏ yếu tố mạng. Em chỉ thêm content sensitivity vào reward/simulator để khi phải chọn bitrate, hệ thống biết ưu tiên đoạn quan trọng hơn.”

Nói nôm na là:

Không phải tao vứt cái xe máy đi rồi bảo đây là máy bay. Tao chỉ gắn thêm cái kính chiếu hậu để nhìn đường tốt hơn.

Nhưng ông thầy vẫn không buông.

Ổng kiểu:

“Không. ABR là mạng. Plume, SENSEI không kết hợp kiểu này được.”

Tao đứng đó nghe mà trong đầu vang lên nhạc nền One Piece đoạn Luffy bị đấm xuống đất.

Tao nghĩ bụng:

“Đụ mẹ, nếu cái gì cũng phải y chang bản gốc thì nghiên cứu làm con cặc gì? Lấy sách giáo khoa photo ra nộp cho nhanh.”

Nhưng ngoài mặt tao vẫn phải ngoan:

“Dạ em không nói em triển khai lại Plume hay SENSEI. Em dùng các bài đó làm nền tảng tham khảo. Ý tưởng là lấy cảm hứng từ sampling, sensitivity, content-aware decision rồi xây prototype riêng.”

Tức là tao đã nói rõ:

  • Không copy công thức tác giả.
  • Không nói nhãn của tao giống nhãn tác giả.
  • Không bảo đây là hệ thống production.
  • Không nhận vơ “em là cha đẻ Netflix thế hệ mới”.
Nhưng không.

Hai ông vẫn dí tiếp như chó nghiệp vụ thấy vali khả nghi ở sân bay.

Ông thứ hai bắt đầu hỏi:

“Dữ liệu em lấy ở đâu?”

Tao bảo:

“Dạ tác giả không public dataset gốc, nên em dùng KoNViD-1k. Đây là dataset video được dùng trong nghiên cứu đánh giá chất lượng video, có MOS, nguồn uy tín.”

Ổng hỏi tiếp:
“Thế em có train AI/model không?”
Tao nói:
“Có. Em chia video thành chunk, trích đặc trưng từng chunk, tạo proxy label từ các đặc trưng đó về thang 0 đến 1, rồi train model như Ridge, Random Forest, MLP để học mối quan hệ giữa đặc trưng chunk và độ nhạy cảm.”
Tao tưởng giải thích vậy là ổn rồi.
Ai dè ông đó phán:
“Em không thể lấy data trên mạng rồi tự làm abc xyz như vậy được.”
Đụ mẹ nghe câu đó tao đứng hình 2 giây.
Trong đầu tao lúc đó:
“Ơ thế dataset open sinh ra để làm gì? Để cúng à? Để tải về rồi ngắm thumbnail cho vui à?”
Tao lại phải giải thích:
“Dạ em không khẳng định đây là ground truth hoàn chỉnh. Em có ghi rõ trong báo cáo là proxy label, là bản thử nghiệm, dùng để chứng minh pipeline tồn tại trong simulator.”
Nghe tới chữ simulator, hai ông cười phá lên.
Đụ mẹ khoảnh khắc đó đúng kiểu tao vừa cast skill mà bị phản damage.
Một ông mặc áo khoác kiểu đô đốc Kizaru trong One Piece, ngồi cười như kiểu:
“Ồ, con mồi hôm nay biết nói tiếng người.”
Ông còn lại thì mặt kiểu:
“Thôi xong, tao đéo hiểu thằng này đang thuyết trình cái gì, nhưng tao vẫn phải ngồi đây tới hết giờ.”
Tao đứng trên đó, tay lạnh như vừa bóp cục đá trong Circle K, mồm thì cố nói, não thì mở 16 tab Chrome, tab nào cũng Not Responding.
Lúc đầu tao run thật.
Run kiểu:

  • Miệng nói “dạ thưa thầy”.
  • Trong lòng nói “đụ mẹ cứu tao”.
  • Tay bấm slide mà sợ bấm nhầm qua trang kết luận.
  • Mắt nhìn hội đồng mà cảm giác như nhìn boss cuối trong Dark Souls.
Nhưng sau khoảng 10 phút bị dí, tự nhiên tao hết run.
Không phải vì tao tự tin.
Mà vì tao cay
Cay quá nên não tự bật chế độ sinh tồn học thuật.
Tao bắt đầu lôi hết đồ nghề ra nói.
Tao nói:
“Dạ ABR truyền thống dùng throughput, buffer, bitrate history. Cái em làm không phủ nhận điều đó. Em chỉ thêm yếu tố content sensitivity. Khi mạng yếu, vẫn phải giảm bitrate. Nhưng nếu buộc phải giảm, thì nên giảm ở đoạn ít quan trọng trước, giữ chất lượng cho đoạn quan trọng hơn.”
Dịch ra tiếng người:
Nếu nhà nghèo phải ăn mì gói, thì ít nhất cũng nên để gói xúc xích cho thằng đang ôn thi, chứ không phải chia đều như ******** thời bao cấp.
Tao nói tiếp:
“Nhãn của tác giả và nhãn của em không giống nhau. Tác giả có pipeline và dữ liệu riêng. Em không có dataset gốc nên em tạo proxy label từ feature hình ảnh. Proxy label không phải cảm nhận người dùng thật, nhưng đủ để chứng minh ý tưởng trong phạm vi prototype.”
Nói trắng ra:
Tao đâu có bảo tao tạo ra chân lý vũ trụ. Tao chỉ bảo tao dựng được một mô hình thử nghiệm có đầu vào, có xử lý, có đầu ra, có số liệu, có giới hạn.
Mà hình như mấy ông nghe đến “giới hạn” là dị ứng.
Tao đã ghi rõ:

  • Không phải DASH player thật.
  • Không phải production system.
  • Không có MOS theo chunk chuẩn như lab lớn.
  • Không có hạ tầng kiểu Netflix.
  • Không phải DRL end-to-end như Pensieve.
  • Chỉ là prototype/simulator.
Nhưng hội đồng cứ muốn tao phải vừa là sinh viên, vừa là Netflix, vừa là phòng lab MIT, vừa là nhà mạng Viettel, vừa có server farm, vừa có người dùng thật ngồi đánh MOS.
Đụ mẹ đồ án cơ sở mà đòi như luận án tiến sĩ cộng thêm funding 2 triệu đô.
Xong tao chuyển qua phần lợi ích.
Tao nói hướng này nếu làm tốt thì có thể giúp:
  • Giữ chất lượng ở đoạn quan trọng.
  • Giảm lãng phí bitrate ở đoạn ít quan trọng.
  • Phù hợp với video bóng đá, game, học online, livestream.
  • Mở rộng ABR từ “chỉ nhìn mạng” sang “nhìn cả mạng lẫn nội dung”.
Tao đang nói mà trong đầu nghĩ:
“Đụ mẹ, tao đang bảo cái xe máy có thể gắn thêm GPS, mà mấy ông cứ bảo xe máy là phải có 2 bánh, GPS là làm nó thành tàu vũ trụ.”
Căng nhất là đoạn tranh luận về Plume và SENSEI.

Mấy ông cứ xoáy:
“Công thức của tác giả đâu?”
“Nhãn của tác giả đâu?”
“Em lấy dữ liệu tác giả ở đâu?”
“Em kết hợp thế nào?”
“ABR sao lại thành content-aware?”
“Em có train thật không?”
“Model học cái gì?”
“Label từ đâu?”
“Dataset có phù hợp không?”
Đụ mẹ hỏi không sót một câu. Hỏi kỹ tới mức tao tưởng lát nữa ổng hỏi luôn:
“Em sinh năm bao nhiêu? Lúc 3 tuổi đã có định hướng ABR chưa?”
Tao trả lời từng câu một.
Tao nói:
“Em không dùng nhãn của tác giả. Em tự tạo proxy label. Em không claim đây là kết quả của tác giả. Em dùng các bài báo làm hướng tham khảo. Phần đóng góp của em là pipeline thử nghiệm: video → chunk → feature extraction → sensitivity score → model training → content-aware reward → ABR simulation.”
Tức là cái luồng của tao rất rõ:

Video đầu vào
→ chia chunk
→ lấy đặc trưng từng chunk
→ tạo điểm nhạy cảm
→ train model dự đoán điểm đó
→ đưa vào simulator
→ so sánh cách chọn bitrate

Nó đéo phải ma thuật.
Nó cũng đéo phải bùa ngải.
Nó là pipeline thử nghiệm.
Nhưng cái khổ là khi người nghe đã chốt trong đầu rằng “ABR chỉ là mạng”, thì mày nói thêm nội dung vào là họ tưởng mày đang phạm tội phản quốc với ngành streaming.
Đến cuối buổi, tao cảm giác mình không còn đang bảo vệ đồ án nữa.
Tao đang bảo vệ quyền được tồn tại của cái ý tưởng:

“Video có nội dung, và nội dung có thể ảnh hưởng đến quyết định chọn bitrate.”

Nghe đơn giản vãi lồn đúng không?
Vậy mà cãi 30 phút.
Có đoạn tao nhìn ông mặc áo Kizaru, tao nghĩ:
“Chắc lát nữa ổng đứng dậy bắn tia sáng bảo: ‘Em làm sai bản chất ABR rồi nhaaa~’”
Còn ông kia thì cứ kiểu nửa cười nửa khinh, làm tao cảm giác mình không phải sinh viên báo cáo, mà là thằng bán kem trộn bị quản lý thị trường bắt quả tang.
Nhưng công nhận một điều: bị dí như vậy mới biết trong đầu mình còn cái gì.

Lúc đầu tao run như chó đi tiêm.
Giữa buổi tao cay.
Cuối buổi tao nói như thằng bị nhập.

Cái gì biết tao lôi ra hết:
  • ABR truyền thống.
  • Throughput.
  • Buffer.
  • Bitrate.
  • Content sensitivity.
  • Proxy label.
  • Simulator.
  • Train model.
  • Ridge, Random Forest, MLP.
  • Dataset KoNViD-1k.
  • Giới hạn của đồ án.
  • Khác biệt giữa prototype và hệ thống thật.
Tao không dám chắc mấy ông hiểu hết. Nhưng ít nhất tao không chết đứng.

Sau buổi đó tao rút ra vài điều.

Thứ nhất, đi bảo vệ đồ án không phải chỉ cần slide đẹp. Slide đẹp mà gặp ông thích chém thì vẫn bị chém như thường.

Thứ hai, mày phải biết rõ mày đang claim cái gì. Mày mà nói quá lên là chết. Tao sống được một phần vì tao cứ bám vào câu:

“Đây là prototype/simulator, em không khẳng định là hệ thống production.”

Thứ ba, dataset open không có tội. Tội là mày không giải thích được tại sao dùng nó, dùng để làm gì, giới hạn ở đâu. May là tao còn nói được đoạn KoNViD-1k và proxy label, chứ không chắc bị xiên tại chỗ.

Thứ tư, ABR đúng là gắn với mạng. Nhưng nói ABR chỉ được nhìn mạng thì khác đéo gì nói điện thoại chỉ được dùng để gọi, ai cài Facebook là làm sai bản chất Nokia 1280.

Thứ năm, hai ông thầy cười phá lên thì cay thật. Nhưng nghĩ kỹ cũng hài. Một thằng sinh viên đứng giữa phòng cố giải thích content-aware ABR, hai ông thầy một ông như Kizaru, một ông như NPC khó chịu trong game, không khí thì căng như dây đàn. Cảnh đó mà quay lại up TikTok chắc viral mẹ nó luôn.

Chốt lại, buổi bảo vệ hôm nay như một trận boss fight.

Tao vào phòng với 50% máu, 20% tự tin, 100% lo sợ.
Boss phase 1: hỏi ABR.
Boss phase 2: hỏi Plume/SENSEI.
Boss phase 3: hỏi dataset.
Boss phase 4: hỏi train model.
Boss cuối: cười vào chữ simulator.

Tao không biết kết quả cuối cùng ra sao, nhưng tao biết một điều:

Tao không đứng im chịu chém.

Tao có run, nhưng vẫn cãi.
Tao có bí, nhưng vẫn quay lại được.
Tao có bị cà khịa, nhưng vẫn giữ được lõi đề tài.

Và cái lõi đó là:
ABR vẫn là bài toán chọn bitrate. Tao chỉ thử thêm yếu tố nội dung để việc chọn bitrate bớt ngu hơn.

Thế thôi.
Đụ mẹ, nghiên cứu mà đéo cho thử hướng mới thì thôi gọi là chép phạt học thuật cho rồi. Còn nếu thử hướng mới mà bị hỏi vặn thì cũng đúng, vì đó là hội đồng. Nhưng hỏi xong làm ơn nghe câu trả lời, chứ đừng chốt sẵn trong đầu rồi bắt sinh viên tự bơi trong nồi lẩu phán xét.
Hôm nay tao không biết mình thắng hay thua.
Nhưng tao biết chắc một điều:
Code chưa giết tao. Dataset chưa giết tao. Model chưa giết tao.
Tao thì khác...!
làm đồ án cũng fail cho được, hạng lesor của xh, chắc là người khác làm hộ, chứ không phải m đúng k
 
Đến cái văn miêu tả cũng đéo viết được hẳn hoi lại còn để AI viết cho thì chạy grab là đáng lắm :vozvn (53):
 

Có thể bạn quan tâm

Top