Google “mở” mã nguồn portrait mode của công nghệ AI camera

Google “mở” mã nguồn portrait mode của công nghệ AI camera

Chiếc điện thoại Pixel của Google có camera chụp hình rất đẹp nhờ công nghệ AI và nay hãng quyết định chia sẻ mã nguồn công cụ “làm mờ hậu cảnh” từ công nghệ này.

Thông tin này được Google công bố trên trang blog của hãng hồi đầu tuần và phần mã nguồn được “mở” là đoạn code được hãng đặt tên là DeepLab-v3+. Chính xác hơn thì đó là mã nguồn của công cụ AI cho chế độ chụp hình chân dung xóa phông hay vẫn được gọi là làm mờ hậu cảnh.

DeepLab-v3+ là công cụ chia tách hình ảnh (image segmentation), sử dụng công nghệ máy học được gọi là CNN (Convolutional Neural Network), một dạng mạng nơ-ron nhân tạo trong đó mô hình kết nối giữa các nơ-ron được lấy cảm hứng từ tổ chức vỏ não thị giác của động vật. Nó phân tích các đối tượng trong một bức hình và chia tách họ ra, tách biệt các thành phần tiền cảnh và những yếu tố cảnh nền.

Google Image Segmentation Tool

Quá trình phân tách tiền cảnh và hậu cảnh của công cụ Image Segmentation

Mặc dù nghe có vẻ không có gì ấn tượng nhưng đây là một công cụ đặc biệt hữu dụng cho camera. Google đã dùng chính công cụ này để xử lý các ảnh chụp portrait mode trên điện thoại Pixel, giúp tạo ra những tấm ảnh chụp chân dung khá ấn tượng với chủ thể xuất hiện nổi bật trên nền hậu cảnh được làm mờ đi. Tính năng này có thể khá quen thuộc với người dùng iPhone, nhưng công nghệ của Apple sử dụng hai ống kính camera để tạo ra hiệu ứng này, còn Google chỉ sử dụng một ống kính.

Theo các kỹ sư phần mềm của Google thì công nghệ chia tách hình của họ đã được cải thiện rất nhiều nhờ vào công nghệ máy học, đạt đến mức độ chính xác cao không tưởng so với năm năm về trước. Tuy nhiên, Google vẫn quyết định chia sẻ mã nguồn công nghệ này cho cộng đồng, với mong muốn mọi người sẽ giúp cải thiện công nghệ này tốt hơn nữa.

Nguồn: Trainghiemso.vn

Загрузка...

Leave a Reply