View of An Explainability-Driven Framework for Interpretable Cross-Modal Image-Text Retrieval Using CLIP | International Journal of Latest Technology in Engineering Management & Applied Science