Tham dự Tech Lounge

Tham dự Tech Lounge


Google AI tái tạo ảnh siêu phân giải quá đỉnh

tuanlionsg
31/8/2021 10:37Phản hồi: 140
Google AI tái tạo ảnh siêu phân giải quá đỉnh
AI siêu phân giải của Google tăng thêm công lực cho việc xử lý hình ảnh. Máy học (ML) sẽ tổng hợp hình ảnh tự nhiên từ kho dữ liệu ảnh, và ứng dụng cho nhiều tính năng xử lý ảnh, siêu độ phân giải là một ứng dụng. Tính năng siêu độ phân giải có nhiều hữu ích, cụ thể nhất là có thể khôi phục các ảnh chân dung có kích thước rất nhỏ, ít chi tiết thành bức ảnh có độ phân giải chi tiết cao.

cascade_fig.jpg

Goolge gọi là “mô hình khuếch tán” SR3, hoạt động cơ bản bằng cách thêm dần hạt nhiễu vào, phủ lấp các chi tiết dữ liệu và cả khoảng trống chi tiết cho đến khi chỉ còn nhiễu hạt mà thôi, rồi thuật toán chạy đảo ngược quá trình để tổng hợp dữ liệu nhiễu thuần tuý bằng cách giảm dần dữ liệu đến khi còn lại mẫu sạch dựa trên mẫu ảnh đầu vào đã được bù chi tiết ở những điểm bị trống từ ảnh gốc. Họ gọi là thuật toán tối ưu hoá theo mật độ dữ liệu để tạo ra các mẫu tốt hơn.

Sequence 01_2.gif

Sequence 01_3.gif


Sequence 01_4.gif

Sequence 01_6.gif
SR3 lấy đầu vào là hình ảnh có độ phân giải thấp rồi chạy để tái tạo thành hình ảnh có độ phân giải cao, ở bước đầu được gọi là làm hỏng hình ảnh bằng cách phủ nhiễu hạt, thêm vào cho đến khi chỉ là hạt nhiễu. Rồi máy học sẽ học cách đảo ngược quy trình này, loại bỏ dần nhiễu, giữ lại nhiễu thuần tuý dựa trên mẫu ảnh đầu vào để có kết quả bức ảnh nhiều chi tiết hơn. SR3 cũng chạy các mô hình xếp nhiều lớp để tăng tỷ lệ siêu phân giải hiệu quả hơn. Chẳng hạn xếp chồng mô hình khuôn mặt 64x64 -→ 256x256 và 256x256 -→ 1024x1024 đó chính là động tác thực hiện phục hồi siêu phân giải từ 64x64 -→ 1024x1024.
image3.gif
super_res_examples.png
image4-2.png
Độ chính xác của SR3 là rất khả quan, nhưng Google còn bước xử lý với mô hình cao hơn, gọi là CDM - khuếch tán có điều kiện theo lớp được học dựa trên kho dữ liệu ImageNet tạo ra ảnh siêu phân giải và tự nhiên hơn. ImageNet là tập dữ liệu khó, được xây dựng thành một chuỗi nhiều mô hình khuếch tán cùng lúc, hoạt động phân tầng, xâu chuỗi nhiều mô hình với nhau, tạo nên độ phân giải cao nhất.

image2.png
image1.png
Nhiều người hy vọng rằng, mô hình này sẽ sớm trở thành tính năng mặc định không chỉ ở giai đoạn phục hồi (hậu kỳ) ảnh, mà ngay tức thì khi chụp ảnh. Chẳng hạn chụp một bức ảnh zoom bằng kỹ thuật số trên điện thoại, ở 10x, 20x,… 50x chẳng hạn, độ phân giải chỉ còn rất ít, đó là giới hạn làm đau đầu nhiều nhà sản xuất. Điện thoại rất khó đến gắn ống kính tele quang học chất lượng. Nếu phần mềm giải quyết được điều này, cũng là thêm một ưu thế cho người dùng.

Xem thêm: https://iterative-refinement.github.io
SR3: Image Super-Resolution via Iterative Refinement
iterative-refinement.github.io
140 bình luận
Chia sẻ

Xu hướng

Wahhh, đỉnh quá
@asterix0108 Các fan của JAV sẽ thích điều này
@thienvk Decensored 😂😂😂 nhưng vẫn còn mờ lắm. Vì Uncen nó dùng Mosaic làm nhiễu, và trong video nữa nên là Decen chưa được chuẩn
@lady_killer2401 Thank bác dịch hộ tiếng Anh. Nhưng mà như vậy thì càng đúng như mình suy đoán. AI tạo ra chẳng giống gì? Mắt báo thật vừa sắc vừa oai. Mắt báo AI vừa méo vừa thộn. 😁 Lại còn bị bên to bên bé. 😆
Chưa kể những cái đốm trên mình nó sai tè le. :v
Chứng tỏ AI tự lấy ảnh đâu đó thêm vào. Giỏi thì giỏi thật .... Có giá trị trong nhiều tình huống. Nhưng ko có giá trị trong việc cần chính xác cao như việc phá án mà nhiều người mơ ước. :v
@maithang215 Cái này giống với việc phác họa chân dung bên CS vẫn làm. Giờ là level AI, về cơ bản là không dùng để khẳng định được nhưng có thể dùng để nhận dạng được
Ngon. Nếu dùng rộng rãi mình có thể làm lại những tấm hình chụp hơn chục năm trước
@PH Design bác Hồ là câu chuyện khác hoàn toàn b ạ !
demen72
TÍCH CỰC
3 năm
@Sugar•J Bạn tải App Remini và dùng Enhance để chỉnh ảnh mờ chất lượng thấp của ông bà cha mẹ ngày xưa đi bạn, bạn sẽ thấy rất bất ngờ đó
valve
TÍCH CỰC
3 năm
@zer0_7 Khác chỗ nào nói nghe coi? Hay bác của bạn là cấm kị ko được đụng vô?
@valve Ko hiểu ý lại đi đặt câu hỏi chán chả buồn trả lời.
Đỉnh cao của upscale 4K
danh hoà
ĐẠI BÀNG
3 năm
Rất có tính thực tế. Công nghệ này có giống với công nghệ trên tivi samsung đẩy hình mờ nhoè lên độ phân giải cao hơn không nhỉ?
@danh hoà Nếu video bạn đang phát là 30fps thì phần mềm phải xử lý liên tục xong mỗi khung hình trong 1/30s, phần cứng đơn giản như TV không thể làm nổi.
Còn các thuật toán quảng cáo là AI trên TV đơn giản hơn cái này rất nhiều mới có thể chạy được.
heomat
ĐẠI BÀNG
3 năm
@danh hoà Chắc chắn phải khác chứ. Nó hoàn thiện thì cho các video trên youtube và các nguồn khác upscale kên 8k thì đinhr
tamdinh69
TÍCH CỰC
3 năm
@tuanlionsg
Có app nào giúp làm rõ các video bị làm mờ không các anh? Xem mà tứkkk cái văn hóa Nhật, hehehe
Cười vui vẻ
tiachop22
TÍCH CỰC
3 năm
@tamdinh69 Có nhé bác, dùng Topaz video enhance ai là VCD lên fullHD luôn.
@tiachop22 cái này làm đc thật ko đấy bro
Cười vô mặt
@tamdinh69 Có thì cũng có, nhưng thật ra thì nó ko phải là hàng "real", mà là nó dùng thuật toán & AI để ghép cái xxx thật trong model (dữ liệu được huấn luyện trước đó) vào mấy chỗ pixel bị làm mờ thôi, cho nên khi bác đang coi thân hình nóng bỏng của em J thì bộ phận xxx lại là của em Y nào đó thôi 😂

https://home.vnreview.vn/tin-tuc-xa-hoi-so/-/view_content/content/3076138/nganh-cong-nghiep-phim-khieu-dam-nhat-chao-dao-vi-phan-mem-ai-bien-phim-co-che-thanh-khong-che
Cơ hội để nâng chất lượng các hình ngày xưa
@zombie01 Chuẩn bác, nhờ AI mà những tấm hình xưa hay những bộ phim cũ sẽ có chất lượng tốt hơn, và cả camera trên smartphone nữa
cencored convert to uncensored , quá đỉnh
Cười vô mặt
Screenshot 2021-08-31 234316.png
Quá đỉnh, cần mẹ gì cảm biến to nữa
Mảng AI thì thằng nào làm lại GG nữa
@6922723pro Thì làm gì có thằng nào sở hữu kho ảnh kho dữ liệu đồ sộ bằng gg đâu mà hihi
@6922723pro may ra có nVidia, mà nvidia có mỗi phần cứng chứ làm gì có data =))
Bibusama
TÍCH CỰC
3 năm
@Khoa Monster Có Apple đó, ng dùng nhiều nhất, ảnh khả năng cao ảnh cũng nhiều nhất. Sắp sửa update chính sách cho AI quét ảnh trên icloud rồi, xong xuôi update lần nữa quét ảnh trên máy nữa là trùm luôn =))
@Bibusama Mấy người xài IP đa phần cũng xài kèm gg photo để up free mà, sau này bắt đóng phí nên giảm đôi chút thôi.
anh523110
TÍCH CỰC
3 năm
@Bibusama Gg photo nha bạn. Apple chưa có tuổi 😀
nvabkhn
ĐẠI BÀNG
3 năm
Cái này người dùng phổ thông như mình đã được dùng chưa các bạn ơi?
anh523110
TÍCH CỰC
3 năm
@nvabkhn Dự án của GG mới đg nghiên cứu chưa ứng dụng thực tiễn
hoang559
TÍCH CỰC
3 năm
Uncen tốt quá, hóng🤥
alexnam
TÍCH CỰC
3 năm
VTV sẽ cho chiếuu lại Nhật Ký Vàng Anh bản 4k dựa vào công nghệ này :v
catmanrt
ĐẠI BÀNG
3 năm
móa ơi, khó tin quá, riết như mấy phim khoa học viễn tưởng hay phim hành động Mẽo. Cỡ nào cũng có thể làm rõ được.
A gồ đem lên pixel 6 sắp tới thì ngon.
lPhong1
ĐẠI BÀNG
3 năm
@phatkrongana Nó mà áp dụng trong chip tensor mới thì...
Với hàng tỷ tỷ tỷ bức ảnh mà dự án Google Photo mang về thì mấy con AI được train thuật toán đảo ngược resize này ra trò vcl. Dữ liệu đủ xài, trong khi chi phí nguồn lực cho việc mở rộng dung lượng cho enduser quá lớn, việc thu phí user cho up ảnh độ phân giải gốc lên Photo từ pixel lại quá hợp lý.
Kelvin1992
TÍCH CỰC
3 năm
Công nghệ này có j mới đâu, những ai xem Taken 2008 do Liam Nelson đóng cách đây hơn 10 năm sẽ thấy cảnh làm rõ khuôn mặt qua camera
@Kelvin1992 công nghệ trên phim là để lòe thôi, chứ 10 năm trước làm gì có ai làm được
Kelvin1992
TÍCH CỰC
3 năm
@nhtphuc đùa thôi mà
@Kelvin1992 Trong AI, bác có ý tưởng gì GG một cái là đã có thằng làm rồi. Quan trọng là accuracy đạt bao nhiêu % thôi. Để làm dc 95% có khi rất dễ, nhưng lên 97% khó như lên trời.

Giống như việc AI trong chụp ảnh vậy. Thằng nào cũng kêu máy tao có AI, mà ko có thằng nào tự tin ko nâng cấp phần cứng mà đọ lại pixel của GG.
Đã có app về cái này hoặc tương tự cái này chưa chủ thớt nhỉ ?
@Hai chín sê Dạ chưa.
hungp2104
ĐẠI BÀNG
3 năm
@Hai chín sê remini
tiachop22
TÍCH CỰC
3 năm
@Hai chín sê App cụ thể thì chưa nhưng bạn có thể tìm hiểu về TecoGan, cũng có những ứng dụng áp dụng nó

https://github.com/thunil/TecoGAN
nforce
TÍCH CỰC
3 năm
@Hai chín sê app thì chưa nhưng pre-trained model thì nhiều nha. Vd ESRGAN khá phổ biến
@tiachop22 Chắc bác làm AI cũng biết. Nếu chỉ lôi bản pre-trained model về thì còn lâu mà thương mại dc. Ý tưởng ko có gì mới, có cả chục năm rồi. Quan trọng là nó thật đến đâu
DanielTran
ĐẠI BÀNG
3 năm
Hiện giờ Remini làm cái này tốt nhất, hóng anh em giới thiệu thứ tốt hơn!
@DanielTran Nhưng mà nét mặt vẫn tây quá bác à 😥
@DanielTran Remini là kiểu ghép ảnh khác vào, còn cái này là kiểu phục hồi luôn, cái nào cũng đỉnh.
beluxubu
TÍCH CỰC
3 năm
Mình không tin nếu không tự test bằng ảnh của mình
@beluxubu giống bạn, đang chờ link online để test thử.
beluxubu
TÍCH CỰC
3 năm
@khanhduong171 Ảnh bị mất quá nhiều chi tiết, nên việc này không gọi là tái tạo mà chỉ là ghép ảnh dựa trên hình dạng mà AI nhận diện được. Ví dụ hàm răng chỉ có vài đốm trắng, thì kết quả là lấy răng ai đó ghép vào thôi.

Xu hướng

Bài mới









  • Chịu trách nhiệm nội dung: Trần Mạnh Hiệp
  • © 2024 Công ty Cổ phần MXH Tinh Tế
  • Địa chỉ: Số 70 Bà Huyện Thanh Quan, P. Võ Thị Sáu, Quận 3, TPHCM
  • Số điện thoại: 02822460095
  • MST: 0313255119
  • Giấy phép thiết lập MXH số 11/GP-BTTTT, Ký ngày: 08/01/2019